首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
基于传统的Mel倒谱系数(MFCC)系列特征的语音识别系统在噪声环境中的识别性能会急剧下降。为了进行噪声环境中的自动语音识别,提出了一种反映语音信号谐振程度的特征:谐振强度,并用之代替传统MFCC特征中的能量维(零维倒谱C0,或者帧能量E)。在展览馆噪声、人群噪声和汽车噪声等情况下的语音识别实验结果表明:基于这种新特征的语音识别系统比基于传统特征的语音识别系统有更高的平均识别率和更好的抗噪声能力。  相似文献   

2.
语音增强用于抗噪声语音识别   总被引:12,自引:1,他引:11  
语音识别系统通常是将在安静的环境下训练得到的参数应用于实际环境中。如果实际环境也是安静的 ,则语音识别系统可以令人满意地工作。然而 ,当实际环境中有噪声存在时 ,语音识别系统性能急剧下降。为了让语音识别系统在安静的环境和有噪声的环境中都获得令人满意的工作性能 ,研究了一个将语音增强器和语音识别器级连起来的系统。该系统中 ,语音增强作为前端处理用于提高识别器输入端信号的信噪比。通过 3种不同的增强算法用于纯净语音和3种类型带噪语音的实验结果分析比较表明 ,这一方法对纯净语音的识别精度几乎没有任何改变而大大提高了系统的抗噪声性能  相似文献   

3.
语音端点检测(voice activity detection,VAD)是在连续语音信号中,将语音和非语言片段分离的技术。VAD在语音识别、说话人识别、语音编码等领域起着重要作用。传统VAD算法在类型已知的噪声环境下可以达到较好的性能,但在实际情况中,未知噪声的影响通常会使系统性能下降显著,在差异化噪声下的VAD是端点检测的研究难点。在总结现有语音端点检测算法基础上,提出了一种基于深度神经网络的语音端点检测方法,同时结合维特比算法,与基于贝叶斯信息准则(bayesian information criterion, BIC)的混合高斯模型(gaussian mixture model,GMM) 语音端点检测系统进行对比,在大词汇连续语音识别系统中的实验结果表明,将深度神经网络结合维特比算法,应用于语音端点检测,在复杂噪声环境下取得了更好的效果,适应性更强。  相似文献   

4.
融合语音增强与后续补偿的抗噪声语音识别方法   总被引:2,自引:1,他引:2  
为了提高基于隐含Markov模型的语音识别系统在噪声环境中的稳健性,研究了一种融合语音增强与后续补偿的抗噪声语音识别方法.在前端,语音增强有效地抑制背景噪声,从而提高了输入信号的信噪比.语音增强后的剩余噪声以及语音失真是对语音识别不利的因素,其影响将通过识别阶段的并行模型合并或特征提取阶段的倒谱均值归一化得到补偿.实验结果表明,此方法能够显著地提高语音识别系统在噪声环境中,特别是低信噪比条件下的识别精度,如对-5 dB的自噪声,该方法可将识别精度从11.7%提高至71.0%.  相似文献   

5.
为解决文本无关说话人识别中训练与识别环境不同导致模式失配的问题,提出了一种采用语音增强模块进行前端预处理的i-向量说话人识别系统,从而提高系统对于环境噪声的鲁棒性.为评估不同语音增强算法的性能,利用NIST08核心测试集进行仿真实验.采用IMCRA算法对语音进行噪声估计后,分别用维纳滤波法、MMSE-LSA、传统谱减法和多频带谱减法等4种方法进行语音增强前端处理,在基于i-向量的说话人识别系统下进行实验.实验结果表明采用了语音增强的系统具有一定抗噪声性能,并且在高信噪比条件下,基于多频带的谱减法在此系统下性能最佳,而低信噪比情况下MMSE-LSA算法更有优势.  相似文献   

6.
目前基于纯净语音信号的语音识别系统和说话人识别系统都已达到了很高的识别率,但是当信号中含有噪声,特别是含有语音噪声时,识别率就会大大降低.解决这一问题的关键是实现语音与噪声的自动分离.考虑到语音信号的非平稳特性,把时域去相关的思想推广到频域,提出了频域去相关算法,实验结果显示了算法的有效性.  相似文献   

7.
语音识别系统的识别率十分依赖基于Hidden Markov Models(HMM)模型的训练技术.然而,经典的训练算法(Baum-Welch算法)有一个致命的缺陷,即所得最终解依赖于初始值的选取,只得局部最优解,这就影响了系统的最终识别率.针对传统语音识别系统识别率较低的现状,提出了一种改进的小波变换HMM语音识别算法.该算法首先通过小波变换对原始语音信号进行了降噪处理,然后使用语音样本对利用遗传算法改进后的HMM模型进行训练,并用于语音识别.实验结果表明:所提出的算法实用有效,识别率显著提高.  相似文献   

8.
基于标准语音的识别系统在识别带有发音变异的口语语料时,识别率较低。针对这一问题,提出了一种在标准维吾尔语发音字典的基础上生成多发音字典的方法。采用基于专家经验和数据驱动相结合的方法分析了维吾尔语方言口音发音变异规则,构造发音变异集合,生成初始的多发音字典,并运用了自动数据处理算法和门限阈值法,使得能够从方言口音训练语音数据中自动获得精简的多发音字典。实验结果表明:该方法对维吾尔语方言口音的识别性能有提升作用。  相似文献   

9.
基于各类语音模型的语音识别系统中,未知语音与参考模板的匹配度处在临界状态时,系统容易发生误识别。针对这类问题,本文提出了一种聚焦式模糊分段算法,对语音特征矢量进行模糊分段量化;并将其应用于DTW语音系统中,对语音信号进行训练和匹配。实验证明:该算法能够有效提高系统的识别精度,并降低模糊分界内的误识别率。  相似文献   

10.
利用基因算法训练连续隐马尔柯夫模型的语音识别   总被引:2,自引:0,他引:2  
为了提高语音识别系统的性能,基于全域优化的思想,提出了一种用于训练连续隐马尔柯夫模型(CHMM)的新算法——基因算法,并将该算法用于语音识别.用该算法训练CHMM,可得到最佳的模型参数,从而提高了语音识别率.利用该算法训练CHMM,不需要对CHMM的每一个参数单独进行估值,能够在一定的程度上提高训练速度.文中阐述了整个算法,给出了计算机模拟结果,并与传统的训练方法进行了比较.  相似文献   

11.
本文介绍一种用于话音内插系统(Speech Interpolation System)的高灵敏度话音检测器,并用该检测器进行了各种话音瞬态参数的统计分析。该话音检测器通过分析输入信号的短时能量和零交叉率等检测话音信号,采用自适应电平门限和释放延迟等措施提高了话音检测器的灵敏度和可靠性。同时,这种方案对于线路中的信令信息有较强的识别能力。采用本话音检测器对话音信号所做的统计分析不仅得到了具有一定价值的汉语活动规律,而且进一步完善了检测方案。同时,通过汉语和英语话音活动规律的比较表明汉语应用话音内插技术的效果要优于英语。  相似文献   

12.
介绍了国内外语音翻译系统的研究现状,分析了语音翻译系统的基本特点和工作原理,并结合作者在汉语语音识别与合成、英汉机器翻译等方面的工作,探讨了英汉语音翻译系统的设计与实现中的一些关键问题。  相似文献   

13.
语言是说话人和听话人交际的一种工具.一般情况,一个人至少掌握一种语言,用这种语言来说话,表达自己的思想,理解别人表达的思想.无论说话或听话都是使用语言的行为.说话的行为及其结果在语言学中通常称为"言语",是在特定的语言环境中为达到某种交际目的对语言的使用,在这个过程中语境的作用尤为重要.  相似文献   

14.
对ISO近期将发布的MPEG-4中所包含的低速语音参量编码算法作了全面的介绍;详尽描述了其中各个参数的分析和合成过程,并对算法的特点进行了总结。  相似文献   

15.
基于代数码激励线性预测(ACELP)算法,介绍了一种编码速率为4.75kb/s的语音编码算法。算法采用高效的码本结构和码本搜索技术。核算法运算量小,延时小。首先对算法进行了概述,然后分别对算法所采用的开环基音周期分析、自适应码本搜索、代数码本结构以及代数码本搜索方式进行了介绍,重点对算法的代数码本结构和所采用的代数码本搜索方式进行了详细分析。定点C语言模拟结果表明,该算法在4.75kb/s速率上可以合成很高音质的话音。  相似文献   

16.
在二语语音研究领域,年龄方面的研究备受关注也充满争议。国外有许多实验研究,其研究对象一般为目的语国家移民,对母语环境外语学习者的研究不多。国内研究多为思辨性的分析和讨论,缺乏有说服力的实验数据。文章在国内外研究成就的基础上,选取了学习背景相似、学习时间相当的80名中学生进行了语音听辨和朗读测试实验,旨在考察英语学习起始年龄对无自然语境、主要通过课堂学习英语的中国学生的语音感知和产出的影响。实验结果表明年龄对语音产出有影响,对感知无显著影响。语音感知与产出并不同步。  相似文献   

17.
2.4kbps LPC声码器在窄带数字保密通信、卫星VSAT及ISDN中均有广泛的应用前景。传统的LPC声码器可以合成较高可懂度和一定自然度的话音,但其质量尚不令人满意。其主要原因是采用了过于简化的二元激励模型。本文从提高LPC声码器的质量出发,研究了采用混合激励的LPC声码器算法——M—LPC算法。与传统LPC的算法相比,M—LPC算法在激励源、基音检测及合成等方面都作了改进。计算机模拟结果表明,M—LPC算法可合成高质量的话音。本算法已采用TMS 320C25实时实现。主观试听结果表明,2.4kbps M-LPC声码器的质量令人满意。  相似文献   

18.
一种低码率声码器系统的设计及实现   总被引:3,自引:3,他引:0  
在简单介绍G.723.1编解码算法及语音编解码协处理器CT8020后,给出了一种低码率声码器系统的硬件和软件设计及实现方法,着重讨论了该应用系统设计中有关语音数据同步传输等问题的主要处理方法。  相似文献   

19.
语音信息的采集过程中难免会有各种噪声的干扰,噪声降低了语音的可懂度及清晰度,甚至严重影响语音处理的准确性和可靠性。谱减法是语音减噪中最常用的方法,该方法基于人的感觉特性,对语音短时幅度谱进行估计,适用于受加性噪声污染的语音。本文通过统计分析谱减法的增益补偿因子和过减因子参数,研究基于谱减法的藏语语音减噪处理,并取得较为理想的实验结果。  相似文献   

20.
分析了语音信号的非线性特征,用傅里叶谱、吸引子、分维数、李亚普诺夫指数等非线性动力学行为的数值特征表征了语音信号的非线性特征。采用时延语音序列重构语音吸引子,用计盒分维数计算语音波形的分维数。实验结果显示语音波形具有分形特征,语音中存在混沌。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号