期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

融合语音增强与后续补偿的抗噪声语音识别方法 总被引：2，自引：1，他引：2

丁沛曹志刚《清华大学学报(自然科学版)》2003,43(7):919-922

为了提高基于隐含Markov模型的语音识别系统在噪声环境中的稳健性,研究了一种融合语音增强与后续补偿的抗噪声语音识别方法.在前端,语音增强有效地抑制背景噪声,从而提高了输入信号的信噪比.语音增强后的剩余噪声以及语音失真是对语音识别不利的因素,其影响将通过识别阶段的并行模型合并或特征提取阶段的倒谱均值归一化得到补偿.实验结果表明,此方法能够显著地提高语音识别系统在噪声环境中,特别是低信噪比条件下的识别精度,如对-5 dB的自噪声,该方法可将识别精度从11.7%提高至71.0%. 相似文献

2.

一种新的抗噪语音识别方法

林劼吉明刘玓《实验科学与技术》2005,3(4):13-16

通过子带Wiener滤波结合PUM(Probabilistic Union Model)模型,实现在噪声环境下连续字语音识别的方法。该方法先通过对语音信号进行子带Wiener滤波预处理消除已知噪声,为PUM模型提供只有局部被噪声污染的语音信号,再利用PUM模型进行抗噪语音识别。试验表明在各种不同的噪声环境下,该新方法有更高的平均识别率。相似文献

3.

PMC在噪声环境下的语音识别中的应用

下载免费PDF全文

金连斌丁庆海陈显治《解放军理工大学学报(自然科学版)》2001,2(2):42-45

今天的语音识别正处于由实验室技术走向实用化,产品化的关键时期,然而,现有的绝大我数语音识别系统在噪声环境中的性能都不可避免地急上降,环境噪声已经成为语音识技术商品化的一个主要障碍,因此在语音识技术逐渐走向实用化的过程中,噪声语音识别日益成为一个重要的研究领域,遗憾的是,由于噪声语音识问题本身的复杂性,至今还没有一种方法可以圆满地解决这一问题,拟从模型补偿方面,对噪声环境下的孤立词语音识别进行一些探索,重点研究一个在噪声环境下的语音识别算法－－并行模型组合方法（PMC）,详细论述了其原理以及在噪声环境下的语音识别中的应用。实验中,我们使用汉语的数字语音,分别在3种不同噪声不同信噪比条件下对这一方法进行了识别率测试,结果显示,该方法有着令人振奋的识别效果。相似文献

4.

基于时/频ICA的PMC模型卷积噪声估计方法研究

吕钊张贝贝张超《安徽大学学报(自然科学版)》2016,40(5):24-31

为提高卷积环境下语音识别系统的鲁棒性,提出了一种基于时/频ICA(independent component analysis)的卷积噪声模型估计方法.所提算法首先使用ICA方法从含噪语音信号中提取纯净语音信号的短时功率谱,然后在MEL滤波器组域内将含噪语音的短时谱减去纯净语音的短时谱,并根据去噪后卷积噪声的短时谱估算其HMM(hidden markov model)模型.在仿真和真实环境下进行了语音识别实验,其识别正确率相比较传统的卷积噪声估计方法分别提升了4.70%和4.75%.实验结果表明,论文所提算法能够实现对卷积噪声的精确估计,并有效提升卷积噪声环境下语音识别系统的性能. 相似文献

5.

战场环境下的军事命令识别技术

路建伟丁庆海朱雪平熊刚《南京理工大学学报(自然科学版)》2002,26(4):438-441,445

由于战场使用环境的特殊性，环境噪声成为军事命令语音识别技术实用化的一个主要障碍。该文利用模型补偿技术，对噪声环境年军事命令语音识别进行探索。重点研究噪声环境下的并行模型组合算法（PMC），详细论述其原理以及在噪声环境下的语音识别中的应用。实验使用了48个高炮射击口令，分别在3种不同噪声，不同信噪比条件下对该方法进行识别率测试，结果表明，该方法具有一定的实际应用价值。相似文献

6.

人工合成噪声环境下的连续英文数字识别系统

陈庆利韦元军李坚石《贵州大学学报(自然科学版)》2006,23(2):171-174

噪声鲁棒性问题是当前语音识别的一个重点,作者提出了一个在已有数据库下通过人为地将噪声和语音信号混合的方法,实现实际环境下的连续英文数字语音识别系统.即通过自设计的程序将采集到的噪声文本根据不同的信噪比随机地添加到现有的语音数据库的语音文本中,使新的数据库中的语音文本符合实际的语音环境.实验结果表明,本系统对带噪声环境下的英文数字的识别率效果好,单词的总体正确识别率达到95.86%. 相似文献

7.

基于VTS的稳健语音识别

赵贤宇欧智坚王作英《清华大学学报(自然科学版)》2005,45(7):892-895

为了进一步提高矢量Taylor级数(VTS)算法的模型补偿精度以及在噪声环境下的识别性能,提出将无监督聚类与VTS算法相结合。无监督聚类算法利用噪声模型之间的Kullback-Leibler距离将含噪语音段划分为若干个子段。然后针对各个子段分别进行一阶Taylor级数展开,并在此基础上逐段估计噪声参数和补偿声学模型。该算法结合一个中文数字串识别系统进行实验,在Babble噪声和Gauss白噪声环境下该算法的误识率相对传统的VTS算法分别下降了27.7%和17.8%。证明这种结合无监督聚类的分段VTS算法能够更加有效地将语音和噪声在倒谱域上的非线性混合模型用一阶线性模型来近似。相似文献

8.

多带同步模型用于噪声环境下语音识别

孙吴镇扬《中国工程科学》2006,8(3):31-34

根据人耳听觉特性，提出新的同步多带最大似然线性回归算法用于噪声环境下语音识别。该算法采用最大似然作为参数估计准则，利用各频带信号同步感知和噪声污染假定的方法进行语音模型补偿，有效地提高了识别系统在噪声环境下的识别性能。相似文献

9.

鲁棒语音识别技术综述 总被引：1，自引：0，他引：1

吕钊吴小培张超《安徽大学学报(自然科学版)》2013,(5):17-24

鲁棒语音识别是为了解决噪声环境所引起的语音识别系统识别和训练不匹配的情况.依据噪声对语音识别系统的影响,从信号空间、特征空间及模型空间3个层面上分别对语音增强技术、特征增强技术及语音模型补偿、增强技术进行了总结,并分析了不同方法的特点、实现及应用. 相似文献

10.

基于独立感知理论的鲁棒语音识别算法

孙暐吴镇扬《东南大学学报(自然科学版)》2005,35(4):506-509

为了提高在噪声环境下语音识别系统的性能,对基于子带独立感知理论的语音识别方法进行了研究.这些方法利用人耳对不同频率信号感知的差异,以及噪声和识别对象的频域特征差异,分别采用线性分析、判决分析、多层感知机以及子带最大似然估计对噪声影响进行补偿.实验表明,子带分析采用非线性策略优于线性策略.基于独立感知假定的子带模型,虽然由于独立性假定丢失了带间相关性,但对于噪声环境下语音识别而言可以捕获噪声和识别对象的频谱差异,从而获得比全带分析更高的鲁棒性. 相似文献

11.

嵌入式中等词汇量英语语音识别片上系统 总被引：1，自引：0，他引：1

王国梁梁维谦刘加刘润生《清华大学学报(自然科学版)》2005,45(10):1393-1396

针对目前嵌入式英语语音识别系统中识别性能较差或硬件资源占用较大的问题,提出了一个在16 b定点数据信号处理语音芯片上实现的非特定人、中等词汇量英语命令字识别系统。该系统采用基于连续隐含M arkov模型(con tinuous dens ity h idden M arkov m ode l,CDHMM)的两级识别网络,通过应用改进的音素体系、B ayes ian信息准则模型参数选择算法、决策树和数据驱动相结合的状态聚类方法、最小互信息改变准则特征选择算法,在保证识别率的前提下,大大降低了模型的存贮空间和计算复杂度。实验表明,对1 235词的英语短句的识别率为96.41%,识别时间为0.46倍实时。相似文献

12.

段长在汉语语音识别系统后处理阶段的应用

李曜刘加《清华大学学报(自然科学版)》2009,(Z1)

针对传统的隐含马尔可夫模型(hidden Markov model,HMM)存在的缺陷,该文提出了一种在识别的后处理阶段使用段长模型的方法,并应用在基于HMM的汉语识别系统上。该方法利用归一化的段长模型对识别系统的解码结果重新打分,比较前后两次算出的分数从而选出更可靠的识别结果。实验表明,通过该方法将段长模型应用在识别过程中,可以显著提高识别系统的性能,大量减少识别结果中的插入错误。数据显示,该方法使识别系统的音节错误率下降了大约10%,识别系统最终的插入错误和删除错误都低于1%。相似文献

13.

基于CDHMM/SOFMNN噪声背景下的语音识别方法 总被引：2，自引：0，他引：2

黄湘松赵春晖陈立伟《应用科技》2005,32(9):4-6

针对噪声背景下传统语音识别系统识别率较低的问题,提出了一种将自组织特征映射神经网络(SOFMNN)与隐马尔可夫模型(HMM)相结合的方法,训练出适应噪声的混合模型.该模型适合于对噪声背景下的语音进行识别.同传统的CDHMM模型以及直接在语音中加入加性噪声训练出的CDHMM模型相比,该模型具有更好的抗噪鲁棒性,在信噪比较低的情况下(2~12 dB),识别率比传统CDHMM模型有明显提高. 相似文献

14.

两级决策的开集说话人辨认方法 总被引：10，自引：0，他引：10

何致远胡起秀徐光祐《清华大学学报(自然科学版)》2003,43(4):516-520

为了减少语音数据量 ,提高处理速度和识别的准确性 ,提出了一种采用公共码本、个人隐 Markov模型 (HMM)和个人拒识阈值进行两级决策来实现开集说话人辨认的新方法。在系统实现时 ,采用了一种改进的语音切分算法来提高输入数据的有效性 ,并将说话人识别和人脸识别融合在一起进行身份验证。实验证明这种融合方法能够有效地降低识别的相等错误率至 1%。相似文献

15.

基于改进的隐马尔科夫模型的语音识别方法 总被引：1，自引：0，他引：1

袁里驰《中南大学学报(自然科学版)》2008,39(6)

针对隐马尔可夫（HMM）语音识别模型状态输出独立同分布等与语音实际特性不够协调的假设以及在使用段长信息时存在的缺陷,对隐马尔可夫模型进行改进,提出马尔可夫族模型。马尔可夫族模型可看作一个数学上由多个马尔可夫链构成的多重随机过程,HMM模型则是双重随机过程,因而,HMM模型可视为马尔可夫族模型的特例。马尔可夫族模型用条件独立性假设取代了HMM模型的独立性假设。相对条件独立性假设,独立性假设是过强假设,因而,基于马尔可夫族模型的语音模型更符合语音实际物理过程。在马尔可夫族语音识别模型中引入状态段长信息,能自动根据语速对语音单元段长进行调整。非特定人连续语音实验结果表明,利用状态段长信息的改进语音识别模型比经典HMM模型的性能明显提高。相似文献

16.

Nonlinear Time-Frequency Distributions of Spectrum Energy Operator in Large Vocabulary Mandarin Speaker Independent Speech Recognition System

王作英《清华大学学报》2003,8(6):667-671

This work demonstrates the use of the nonlinear time-frequency distribution (NL TFD) of a discrete time energy operator (DTEO) based on amplitude modulation-frequency modulation demodulation techniques as a feature in speech recognition. The duration distribution based hidden Markov module in a speaker independent large vocabulary mandarin speech recognition system was reconstructed from the feature vectors in the front-end detection stage. The goal was to improve the performance of the existing system by combining new features to the baseline feature vector. This paper also deals with errors associated with using a pre-emphasis filter in the front end processing of the present scheme, which causes an increase in the noise energy at high frequencies above 4 kHz and in some cases degrades the recognition accuracy. The experimental results show that eliminating the pre-emphasis filters from the pre-processlng stage and using NL TFD with compensated DTEO combined with Mel frequency cepstrum components give a 21.95% reduction in the relative error rate compared to the conventional technique with 25 candidates used in the test. 相似文献

17.

基于分类识别的隐马尔可夫模型语音识别技术

魏明哲《山西师范大学学报：自然科学版》2014,(3):26-29

通过分析基于隐马尔可夫模型(HMM)语音识别的原理,针对模板提取过程中语音信号的基音频率差别增大而出现的语音识别率下降的问题,提出分类识别的方法,通过采用基音周期(Pitch)判决方法,将特征相近的帧合并,并计算基音频率的MEL频率倒谱系数,采用隐马尔可夫模型(HMM)进行语音识别,最终通过仿真实验验证分类识别方法对语音识别率提高的影响,得出此方法的适用环境和范围. 相似文献

18.

噪声环境中基于HMM模型的语音信号端点检测方法 总被引：7，自引：1，他引：6

朱杰韦晓东《上海交通大学学报》1998,32(10):14-16

在噪声环境下如何提高语音信号端点检测的准确性是自动语音识别（ＡＳＲ）研究中的一个重要课题．常用的基于短时能量的端点检测方法对于能量较低的音节或在信噪比较低的环境下,检测性能不够理想．讨论了一种基于ＨＭＭ模型的语音信号端点检测方法．先用训练的方法生成背景噪声和废料的模型,再用Ｖｉｔｅｒｂｉ解码算法对待测信号进行处理,并给出了具体的实现方法．实验测试结果表明,基于ＨＭＭ的端点检测方法的检测性能接近于人工检测,方法是有效的．相似文献

19.

基于ARM的实时语音识别系统在嵌入式系统中的应用

宋一扬李金平《北京交通大学学报(自然科学版)》2004,28(5):92-94,98

在分析语音识别原理的基础上,设计了一个基于ARM和DSP芯片的语音识别子系统,用于嵌入式系统中的语音识别,该语音识别子系统由ARM和DSP芯片为核心,配合其他功能电路,能够独立完成语音识别的工作,ARM芯片作为系统的控制芯片,DSP芯片负责对语音信号的隐马尔可夫模型建立,从而使得嵌入式系统的语音识别更为方便简捷,并且该子系统具有一定的通用性和可剪裁性. 相似文献

20.

汉语连续语音识别中上下文相关的声韵母建模 总被引：8，自引：1，他引：8

李净郑方张继勇吴文虎《清华大学学报(自然科学版)》2004,44(1):61-64

声学建模是汉语连续语音识别中的关键步骤之一。根据汉语语音的特点,采用扩展声韵母(XIF)作为识别基元,并针对XIF基元设计了相应的问题集,利用基于决策树的状态共享策略建立上下文相关声韵模型(Tri-XIF)。将Tri-XIF模型与上下文相关音素模型(Tri-phone)、上下文无关音节模型进行了对比。提出了几种方法用于改善标注、改进问题集和降低模型规模。实验结果表明,Tri-XIF模型与Tri-phone模型、音节模型相比,识别性能有了很大提高,其音节误识率分别降低了24.53%和41.65%。采用了所提出的优化策略后,模型规模降低20%以上,而性能下降很少。相似文献