首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 995 毫秒
1.
本文提出了一种基于模糊矢量量化(FVQ)和隐马尔柯夫模型(HMM)模糊训练的语音识别新方法.利用模糊矢量量化替代了传统方法中的矢量量化,语音特征参数序列经过模糊矢量量化后得到模糊观察符号序列.在此基础上提取出一个反映训练样本总体随机变化特性的模糊观察符号序列,然后用它对该音节的HMM进行一次性全局训练,训练算法经传统的Baum-Welch算法改进得到.经十个汉语数字的对比实验表明,该训练算法大大提高了系统的训练速度,模糊矢量量化与传统的矢量量化相比,不仅提高了隐马尔柯夫模型的鲁棒性,进而提高了系统的识别率,而且在语音训练数据不充足的情况下,也能得到很好的识别性能.  相似文献   

2.
本文讨论了基于非均匀矢量量化、隐马尔可夫模型(HMM)的孤立数字语音识别系统。在现有的连续密度隐马尔可夫模型多说话人孤立数字识别系统中,通常采用 LBG 算法建立矢量码本,并采用全搜索识别算法,这样的结果限制了识别精度和识别速度。本文提出了一种新的系统算法,即用非均匀矢量量化(Non-Uniform Vector Quantization——NUVQ)取代原矢量量化部份,实验结果证明,本系统在识别速度和识别精度上都有了较大的改善。  相似文献   

3.
介绍了用有限态文法引导的基于连续密度隐马尔可夫模型(HMM)的连续汉语语音识别系统.分析了系统的组成,词语的HMM的训练方法和对识别系统的测试结果。实验表明,用有限态文法辅助进行连续语音识别是一种有效的策略;连续密度HMM与基于矢量量化的HMM/VQ相比需要较大的计算量,但可明显提高识别准确率。  相似文献   

4.
变帧率技术在语音识别中的应用   总被引:3,自引:0,他引:3  
变帧率(VFR)分析技术可以在语音识别时,用以丢弃那些特征非常相似的语音帧.文中分析了已有VFR方法的不足,并提出了一种新的VFR方法.这种新方法能够更加突出语音信号中发音变化区域.计算机模拟实验显示,经该方法预处理后的语音送入隐马尔柯夫模型的语音识别系统比传统算法有更高的识别率.  相似文献   

5.
端点检测的准确性在某种程度上直接决定了整个语音识别系统的成败,没有足够准确的端点检测(尤其是起点),精密优选特征类型或识别方法的工作往往劳而无功.噪声环境下语音识别的端点检测技术利用语音信号的倒谱特征作为判决抽样信号帧是否为语音信号的依据,并提出了倒谱距离测量法、基于隐马尔柯夫模型(HMM)的检测法.通过对两种宽带噪声(白噪声和汽车噪声)环境下信噪比从0dB到15dB的带噪语音信号进行的仿真实验结果表明,发现倒谱特征参数的语音信号端点检测方法在噪声环境下具有更强的适应性,更适合于实际的语音处理系统.  相似文献   

6.
用于SOM神经网络语音识别的自适应局部搜索算法   总被引:1,自引:0,他引:1  
采用一种基于自组织特征映射(SOM)神经网络和隐马尔柯夫模型(HMM)法结合的语音识别方法.根据语音信号的相关性,提出了一种自适应局部搜索算法.结果表明,该算法相对于全搜索算法而言,计算量小而又不降低识别率  相似文献   

7.
基于VQ的说话人识别系统的实现   总被引:1,自引:0,他引:1  
王吉林 《高等职业教育》2004,13(6):39-42,48
系统以语音信号的LPC倒谱系数、差值倒谱系数、基音周期和差值基音周期的混合特征参数作为识别的特征矢量集,运用矢量量化(VQ)技术实现了与文本有关的说话人识别。在一个10人,1800个语音的语音库上进行了系统的识别实验,其中单音节语音的平均识别率达到了92%,双音节语音达到了96.67%,四音节语音达到了97.67%。系统用于实时识别也收到了较好的效果。  相似文献   

8.
介绍了一个在微机上实现的有限词,特定人语音识别系统,该系统采用连续,M元高斯混合密度的隐式马尔柯夫模型(CDHMM)为识别方法,以修改后的BaumWelch方法为训练重估算法,文中提出了对语音特征矢量非线性归一化预处理,和对训练数据不足的HMM模型特征空产是进行后处理修正的算法,还提出了一种基于语音知识的模型初始化的方法,经实验证明,系统的识别率可以达到90%以上。  相似文献   

9.
一种抗噪声语音识别方法   总被引:2,自引:0,他引:2  
本文提出了一种抗噪声语音识别新方法,并以这种方法为基础,在SUN工作站上实现了这一系统,实验结果表明,本文提出的方法提高了传统隐马柯夫模型语音识别器的抗噪性能。  相似文献   

10.
本文在统一的框架下描述了隐马尔柯夫模型(HMM)用于语音识别时的各种形式,包括离散HMM、连续混合密度HMM、半连续HMM和最大分量连续HMM等,指出各种模型均是统一形式下的导出形式。文中就离散HMM、连续混合密度HMM和最大分量连续HMM在非特定人全音节汉语语音识别中的应用,从识别率和复杂度两方面进行了性能比较。为提高最大分量连续HMM的识别性能;提出了一种修正的训练算法。  相似文献   

11.
一种新型汉语单音节识别方法   总被引:1,自引:0,他引:1  
介绍了一种新型字基 VQ/HMM语音识别方法: VQ与 HMM分级识别算法。 使得 VQ部分可用作语音识别的第一级处理, HMM部分作第二级识别。在第一级识别中 可引进汉语的音素知识,使 VQ/HMM性能进一步提高,并可用于大字汇表的实时语音识 别,存贮量、计算量均大大减少。用此方法把汉语四声作一个 HMM模型,使汉语 400 个基本音节的识别率达 96%以上.若加上精确四声识别则可识别汉语的 1200种声音。  相似文献   

12.
基于GA/VQ的说话人辨认的研究与实现   总被引:3,自引:0,他引:3  
为了改善在矢量量化说话人识别中,采用模板(码书)表征说话人,模板的质量对识别系统的性能。采用遗传算法改进模板的生成方式,构建了一种GA/VQ说话人辨认系统,给出了一种GA/VQ识别算法,通过遗传操作获得全局优化的说话人模板。实验证明,GA/VQ方法提高了码书的质量,比经典矢量量化识别系统识别率高。  相似文献   

13.
提出了一种新的语音识别方法,该方法综合了VQ,HMM和无教师说话人自适应算法的优点。该方法首先在每个状态通过用矢量量化误差值取代传统HMM的输出概率值来建立VQ-HMM,同时采用无教师自适应矢量量化算法,来改变VQ-HMM的各状态的码字,从而实现对未知说话人的码本适应。本文通过非特定人汉语数码(孤立和连续数码)识别实验,把新的组合方法同基于CHMM的自适应和识别方法进行了比较,实验结果表明该方法鲁棒性好,所需计算量较少,自适应和识别效果远优于基于CHMM的方法。  相似文献   

14.
基于话者分类和HMM的话者自适应语音识别   总被引:2,自引:1,他引:2  
本文提出了一种基于话者分类和HMM的话者自适应语音识别方法,采用对参考话者聚类、并按话者类分别建立HMM模板的策略,对于新注册的用户,系统只需利用其极少量的语音,便可将与之最相近的一类模板指派给新用户,再采用基于谱空间映射的两级自适应方法,使系统自适应到用户的模式下工作.这种方法既提高了识别性能,又降低了自适应的难度,还有利于HMM的建立.讨论了话者分类数和自适应语音数据对话者自适应效果及识别性能的影响,提出了一种在自适应语音数据不足情况下仍具有较好自适应效果的基于FVQ的码本自适应改进算法,该算法还具有对自适应字表不敏感的特点.  相似文献   

15.
基于语音声学特征的情感信息识别   总被引:10,自引:0,他引:10  
为提高情感语音识别的正确率,研究了声学参数的统计特征和时序特征在区分情感中的作用,并提出了一种将两者相融合的情感识别方法。在提取出基本的韵律参数和频谱参数后,首先利用PNN(probab ilistic neura l netw ork)和HMM(h idden m arkov m ode l)分别对声学参数的统计特征和时序特征进行处理。计算它们各自属于每类情感的概率,获得采用加法规则和乘法规则融合统计特征和时序特征的识别结果。实验结果表明:各组特征在区分情感方面的侧重不尽相同,通过特征融合,平均识别正确率相较单独采用统计特征或时序特征均有提高,在最好情况下达到了92.9%。这说明了该方法的有效性。  相似文献   

16.
研究了与文本无关的说话人辨认系统中一种新的使用基音周期方法。在说话人辨认系统中将矢量量化(VQ)、高斯混合模型(GMM)分类器结合,使用升正弦窗函数加权的线性预测倒谱系数(LPCC)。在训练时为训练集中的每个说话人估计一个一维高斯形式的基音周期概率密度函数;在识别时,将测试语音中提取的基音周期在训练集说话人基音周期概率模型中得到的基音周期概率密度对VQ、GMM分类器的似然测度加权,形成新的似然测度。实验结果表明,使用新的似然测度进行与文本无关的说话人辨认比VQ、GMM分类器的辨认率有较大的提高,码字个数为8,测试时间为8s时,辨认率相对VQ提高约13%。  相似文献   

17.
为了有效地减少语音编码的比特数、降低量化误差以及提高解码语音质量,提出了一种二级矢量量化的LPC声码器算法.该算法在模糊聚类与LBG级联的VQ算法的基础上,进一步采用二级矢量量化算法对特征参数矢量进行量化.特征参数为语音的两个特征值:基音周期与增益.第一级码本为矢量码本;第二级码本为误差码本.将该算法应用于LPC声码器中进行仿真实验,结果表明:该算法能有效地降低量化比特数并且减少了量化误差,从而使解码语音质量得到改善.  相似文献   

18.
基于BPNN/HMM神经网络的声学模型研究   总被引:1,自引:0,他引:1  
研制了一种基于BP神经网络和隐马尔可夫模型(HMM)的混合声学模型,BP神经网络的主要功能是把失真语音特征矢量转换成纯净语音特征矢量,而删则对转换后的纯净语音特征矢量进行分类,从模型级补偿的方面来提高语音识别系统的鲁棒性.讨论了一种基于线性预测的MKCC语音特征提取方法,该方法把提取出的失真语音特征矢量作为神经网络的输入,从而实现了特征参数级去噪处理的目的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号