首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 46 毫秒
1.
用于语音识别的基于频谱调整的信道自适应方法   总被引:1,自引:1,他引:0  
语音识别系统在实际应用时,其性能会因各种因素而下降,其中重要的一个因素是信道的不匹配。该文提出了一种新的信道自适应方法——频谱调整法。该方法在频域上定义一个分段线性信道归一化函数,根据最大似然准则利用梯度投影法求其最优参数后,对语音的幅度频谱进行归一化。实验表明,该方法可以利用很少的自适应数据使识别的字错误率下降10%左右。  相似文献   

2.
为提高噪声不平稳或不可估的情况下语音识别的稳健性,提出了利用自回归模型和短时平稳性假设,估计干净与噪声环境的语音数据,建立相应的语音识别模型,以达到抗噪效果的稳健语音信号处理方法。在N o iseX-92的4种噪声环境(w h ite,babb le,vo lvo,destroyer eng ine)从0到20 dB的不同信噪比下的“863”大词汇连续语音标准数据库的平均识别结果表明,该方法能够使得基于段长分布的隐M arkov模型的语音识别系统在25候选时声学层的音节相对错误率下降达到10.85%以下,同时相对正确识别率上升12.13%。  相似文献   

3.
对基于ADSP2186的语音识别电话的硬件结构作了简明的介绍,并阐述了程序设计和内存空间管理的思想和方法。最后对语音识别电话的实用性进行了探讨。  相似文献   

4.
介绍了语音识别技术ASR的发展历史、目前研究方法、技术手段及当前取得的成绩与不足,提出一种新的的研究理论——利用基因算法训练HMM方法.  相似文献   

5.
基于一种听觉模型的特征提取及语音识别   总被引:4,自引:0,他引:4  
该文分析了人耳耳蜗及中枢听觉神经对声信号处理的机理,主要包括耳蜗对声信号的频率分析、柯蒂氏器官毛细胞的从振动机械能到电化学能的转换,听神侧抑制神经网络和增益调整四个层次,建立各个层次上听觉的数学模型。  相似文献   

6.
提出了一种基于双权值神经网络的非特定人连续语音识别的新算法.这种算法可以不经过端点检测和分割,构建连续语音中各不同音节的特征空间覆盖区,可以避免因分割错误而带来的错误识别.通过实验得到了较为满意的识别结果.  相似文献   

7.
通过分析基于隐马尔可夫模型(HMM)语音识别的原理,针对模板提取过程中语音信号的基音频率差别增大而出现的语音识别率下降的问题,提出分类识别的方法,通过采用基音周期(Pitch)判决方法,将特征相近的帧合并,并计算基音频率的MEL频率倒谱系数,采用隐马尔可夫模型(HMM)进行语音识别,最终通过仿真实验验证分类识别方法对语音识别率提高的影响,得出此方法的适用环境和范围.  相似文献   

8.
本文针对线性模型在语音识别中的不足,进行了隐马尔可夫模型(HMM)在语音单字识别中的研究,主要对观察输出概率求解、最佳状态序列寻找、参数估计和模型参数的选择进行了探讨.  相似文献   

9.
对于基于Gauss混合模型-通用背景模型(Gaussianmixure model-universal background model,GMM-UBM)方法的文本无关说话人识别,当测试语音时长缩短到很短时,识别率会严重下降。为了充分利用文本内容信息,该文提出了一种基于K-top多音素类模型混合(KPCMMM)的建模方法。在音素识别阶段,利用语音识别得到训练语音的音素序列,在说话人识别阶段利用音素序列对每个说话人训练多个音素类模型,测试语音则在最相近的音素类模型上进行打分判决,K是选取的相近音素类数。由于音素类定义的不同,KPCMMM方法分为基于专家知识和数据驱动这两类。实验结果显示选择合适的K值可以得到更好的识别结果。不同的音素类定义方法的比较实验结果显示:当测试语音时长小于2s时,对比GMM-UBM基线系统,该方法的等错误率(EER)相对下降38.60%。  相似文献   

10.
提出了一种基于小波变换和ARMA模型的新参数,并将它用于A...N的英文字母的识别。我们使用的数据库是NIST。小波变换要以在高频提供高的频率分辨率,在低频提供高的时间分辨率,而ARMA模型则可以改善LPC模型没有零点的不足。实验结果表明,识别的错误率提高14.27%。  相似文献   

11.
基于传统的Mel倒谱系数(MFCC)系列特征的语音识别系统在噪声环境中的识别性能会急剧下降。为了进行噪声环境中的自动语音识别,提出了一种反映语音信号谐振程度的特征:谐振强度,并用之代替传统MFCC特征中的能量维(零维倒谱C0,或者帧能量E)。在展览馆噪声、人群噪声和汽车噪声等情况下的语音识别实验结果表明:基于这种新特征的语音识别系统比基于传统特征的语音识别系统有更高的平均识别率和更好的抗噪声能力。  相似文献   

12.
The performance of automatic speech recognizer degrades seriously when there are mismatches between the training and testing conditions. Vector Taylor Series (VTS) approach has been used to compensate mismatches caused by additive noise and convolutive channel distortion in the cepstral domain, in this paper, the conventional VTS is extended by incorporating noise clustering into its EM iteration procedure, improving its compensation effectiveness under non-stationary noisy environments. Recognition experiments under babble and exhibition noisy environments demonstrate that the new algorithm achieves 35% average error rate reduction compared with the conventional VTS.  相似文献   

13.
融合语音增强与后续补偿的抗噪声语音识别方法   总被引:2,自引:1,他引:2  
为了提高基于隐含Markov模型的语音识别系统在噪声环境中的稳健性,研究了一种融合语音增强与后续补偿的抗噪声语音识别方法.在前端,语音增强有效地抑制背景噪声,从而提高了输入信号的信噪比.语音增强后的剩余噪声以及语音失真是对语音识别不利的因素,其影响将通过识别阶段的并行模型合并或特征提取阶段的倒谱均值归一化得到补偿.实验结果表明,此方法能够显著地提高语音识别系统在噪声环境中,特别是低信噪比条件下的识别精度,如对-5 dB的自噪声,该方法可将识别精度从11.7%提高至71.0%.  相似文献   

14.
0IntroductionUnder the condition of existing competing speakers,the performance of a speech recognition systemdegradesseriously.Withits capabilityto provide hands-free acqui-sition of speech and directional discrimination,micro-phone array has become widely used in many robust ASRfront-end[1-3].Adaptive beamforming realizes notches in the direc-tions of interferences in current working environment byadapting its weights according to some optimum criteri-on[4].Adaptive microphone array can re…  相似文献   

15.
连续语音识别中的说话人快速自适应技术   总被引:2,自引:0,他引:2  
语音识别技术中说话人快速自适应技术受到普遍关注。该文综述了说话人快速自适应技术在国际上的研究现状 ,并且介绍了本研究组提出的快速自适应方法 ,即最大似然模型插值快速自适应框架及插值算法。与现有的相关自适应方法相比 ,该算法在更复杂的识别系统上同时实现了均值和协方差的自适应 ,并取得较好的自适应效果。当仅有一句自适应数据时 ,识别系统的误识率从 2 8.75 %下降到2 4 .93%。  相似文献   

16.
The development of computational auditory modeling in the last 30 vears is reviewed, and its development in the com trig years is predicted .  相似文献   

17.
介绍了针对歌曲检索中出现的中英混合现象所开发的中英双语识别系统。在双语混合语音识别中,主要面临的2个问题:①在保证双语识别率的前提下控制系统的复杂度;②有效处理插入语中原用语引起的非母语口音现象。为了解决双语混合现象以及减少统计建模所需的数据量,通过音素混合聚类方法建立起一个统一的双语识别系统。在聚类算法中,提出了一种新型基于混淆矩阵的两遍音素聚类算法(TCM),并将该方法与基于声学似然度准则的聚类方法进行了比较。实验结果表明:利用TCM进行音素聚类的识别性能优于基于声学似然度音素聚类的性能,最终得到的中英双语识别系统在纯英文测试集上的短语错误率(PER)相对基线单英文识别系统下降7.19%;在双语混合测试集上PER相对基线混合模型下降13.78%;同时在纯中文测试集上保持了基线单中文识别系统的性能。  相似文献   

18.
用于语音识别的鲁棒自适应麦克风阵列算法   总被引:1,自引:0,他引:1  
对现实环境中存在的混响以及非平稳干扰语音信源等因素导致的算法性能下降,提出了一种用于语音识别的鲁棒旁瓣对消算法。讨论了旁瓣对消算法在自适应麦克风阵列中的应用,分析了算法在不同的混响条件下、不同的干扰源的噪声抑制能力。该算法通过分帧处理将输入信号划分为一系列短时平稳的信号片段。根据当前帧的信噪比决定自适应滤波器的权系数更新方式。采用一定的范数约束来限制自适应滤波器权系数的误调整。实验结果表明该麦克风阵列在混响的现实环境中能够有效抑制平稳噪声源和交叠谈话背景干扰,提高了语音识别器的抗噪性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号