首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
针对归一化方法在连续语音特征曲线调整时存在的问题, 提出一种优化解决方案, 解决了噪声的不稳定性及不可预测性对语音特征的影响. 结果表明, 基于该优化方法建立的鲁棒性连续语音识别模型可实现在实验室干净环境和现实噪音环境下同时得到较好的识别结果.  相似文献   

2.
通过对汉语全音节的声母、韵首、韵腹、韵尾4部分音位分别建立HMM模型,实现对非特定人命令词的识别.该方法在识别阶段将置信度评估和不完全匹配的方法结合起来,在一定程度上提高了识别的质量.经实验证明了该算法的有效性.  相似文献   

3.
近几十年来,语音识别系统已由实验室环境走向真实的世界中.在不同的环境噪声下,识别性能却仍不尽人意,尤其是在低信噪比的环境中.为解决在低信噪比情况下的低识别率的问题,以声学参数MFCC( Mel-frequen-cy cepstrum coefficient)为基础,提出了一种基于统计阈值的倒谱均值方差归一化算法,该算法...  相似文献   

4.
由于战场使用环境的特殊性,环境噪声成为军事命令语音识别技术实用化的一个主要障碍。该文利用模型补偿技术,对噪声环境年军事命令语音识别进行探索。重点研究噪声环境下的并行模型组合算法(PMC),详细论述其原理以及在噪声环境下的语音识别中的应用。实验使用了48个高炮射击口令,分别在3种不同噪声,不同信噪比条件下对该方法进行识别率测试,结果表明,该方法具有一定的实际应用价值。  相似文献   

5.
本文介绍亍脉动阵列算法的原理,给出了语音识别中进行模式匹配使用的动态规划算法和概率匹配算法的实现。这种结构对实时的大词汇量的孤立词或连续语音识别是十分有效的。  相似文献   

6.
7.
本分析了语音识别中的特征降维变换方法和特征鲁棒性问题,经实践证明:基于CDN分布的降维方法适合非特定人语音识别,具有突出的优越性,通过调整模型参数并使用含噪特征训练模型,解决特征鲁棒性问题。  相似文献   

8.
为提高汉语连续语音识别系统的性能,建立了音节间相关的半音节识别单元,并研究了基于这种单元的连续语音识别算法。讨论了基于 D D B H M M 模型和最大后验概率估计准则的连续语音识别的理论基础,依据动态规划的基本原理,提出了一种基于音节间相关的识别单元的汉语连续语音识别算法。依照这种算法,不但能得到最优句子侯选,而且能够在识别过程中得到音节格(即 Nbest句子侯选)的数据结构。最后通过大词汇量非特定人连续语音识别的实验,表明了采用音节间相关的识别单元比基本的识别单元误识率有明显的降低  相似文献   

9.
吴荣娣 《科技信息》2010,(24):132-132,134
介于环境条件的变化以及噪声等因素的影响,识别系统的性能急剧下降的原因而出现的鲁棒性语音识别研究,其试图解决的就是如何在实际环境下提升语音识别系统性能的问题。在理论上,噪声鲁棒性所面临的问题其实就是训练和识别环境之间的不匹配。而这种不匹配通常都会体现在特征参数概率分布的差异上。特征参数规整(归一化,Normalization)可以在一定程度上减小这种不匹配的程度,进而提升系统性能。通常的抗噪声方法主要可以分为三种:前端处理、特征值处理以及模型补偿。直方图均衡化(HEQ)属于特征值处理抗噪声方法的类型。作为一种能够改善线性转换方法缺点的替代方法,直方均衡法(HEQ)已经被用于弥补声失配。  相似文献   

10.
本文介绍了几种用于语音信号识别的模式快速匹配算法。初步的实验结果表明,利用这些算法可以在不降低识别率的情况下,大大减少识别时间。  相似文献   

11.
A novel word graph expansion algorithm for voice command understanding is presented as the basis of a more accurate and robust voice command system. Tests show that the algorithm has much better performance than the generally-adopted N-best algorithm while maintaining high computational efficiency. Also the error tolerance method used to improve the robustness of the voice command understanding module further decreases the understanding error rate (UER) to 16. 6% with the computational efficiency almost unchanged compared to the case without error tolerance.  相似文献   

12.
语噪分离技术综合算法及其应用   总被引:2,自引:2,他引:0  
目前,话音记录领域对采集到的音频信号仅仅做到了将静音与非静时分离,而未进一步处理非静音。作者针对这一情况,提出一种综合算法:在静音与非静音分离的 基础上,综合应用语噪识别技术,对前一步分离出来的非静音,进行二次处理,即进行语噪分离和音频信号分类处理。实践证明,该算法切实可行,大大降低了噪声环境下记录系统需要存储的数据量。  相似文献   

13.
语音情感识别是人机交互、情感计算中重要的研究方向.目前普遍使用深度神经网络用于语音情感特征的提取,但使用哪种神经网络模型、如何缓解模型过拟合问题还需进一步研究.针对这些问题,提出了一种结合一维卷积(CNN)以及门控循环单元(GRU)的CGRU模型,从原始语音信号的MFCC特征中提取语音的低阶以及高阶情感特征,并通过随机森林对其进行特征选择,在三种公用的情感语料库EMODB,SAVEE,RAVDESS上分别取得了79%,69%以及75%的识别精度.通过添加高斯噪声及改变速度等方法来增加样本量实现数据扩充,进一步提高了识别精度.通过在线识别系统验证了模型在实际环境中的可用性.  相似文献   

14.
主要讨论了对于小词汇量孤立词的汉语语音识别问题。文中采用欧洲通信标准委员会(ETSI)发布的GSMEFR声码器对输入语音信号进行特征提取。在识别模块采用基于动态规划原理的动态时转弯析(DTW)技术对提取的测试语音参数与训练模板的语音参数进行匹配,得到的误差最小值即为识别结果。实验结果表明,对于20条语音命令,识别准确率达到96%以上,识别时间小于1.5s。  相似文献   

15.
改进了传统的动态时间弯曲算法结构,将其应用到实时语音辨识系统中,并在计算机上进行了仿真。实验结果表明采用改进后的DTW算法有效地降低了待处理数据量和识别时间,提高了系统的运行速度。随着待识别语音信号数量的增多,该算法优势更加明显。  相似文献   

16.
说话人识别的参量研究和语音库建设   总被引:4,自引:0,他引:4  
本文对说话人识别中的几个基本问题进行了研究。语音参量是说话人识别的基础,用矢量量化方法,使用自建的语音库中的材料,研究了说话人识别中的各种参量的效果。实验表明,所采用的参量中,一种混合参量MC最好,倒谱系数CE次之。  相似文献   

17.
汽车噪声中自动语音的识别技术   总被引:6,自引:0,他引:6  
汽车中的话音拨号系统是自动语音识别技术的应用热点.自动语音识别系统是一个基于训练的系统.在汽车噪声中,由于实际应用环境与形成系统参数的训练环境的失配,传统语音识别系统的性能会大幅度地下降,从而无法实用.为了提高语音识别系统在特定环境下的识别率及实用性,首先根据汽车环境中语音的失真模型分析了系统性能下降的原因,然后针对加性汽车噪声与信道失真对系统的影响,讨论了在汽车噪声中改善语音识别系统性能的方法.提出了在识别系统中用基于子带的语音增强算法和倒谱均值相减算法相结合的方法.对大量的多人连续数字串语音的识别实验表明,这一方法大大提高了系统在汽车噪声环境中的识别率,它还可以简便、实时的实现,具有一定的实用性.  相似文献   

18.
提出了一种能够提高ITU-TG.729算法性能的静音检测技术,该技术的引入不仅可以降低G.729的语音通讯平均传输出特率,而且可以大量节省G.729压缩和解压过程的实际运算量,通过在不同的噪声背景下的性能分析,该静音检测技术的引入不会对G.729算法的合成语音质量产生明显的影响。  相似文献   

19.
该文针对LBG算法可能有空胞腔产生及有些码字利用率低的问题,提出了一种改进的矢量量化算法,并将其应用到与文本无关的说话人识别研究,得到了一种新的说话人识别方法.实验表明,这种方法对说话人的识别性能好于基于LBG算法的说话人识别方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号