首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
语音识别中HMM与自组织神经网络结合的混合模型   总被引:9,自引:0,他引:9  
基于隐马尔可夫模型和自组织神经网络模型提出了一种用于语音识别的混合模型,给出了训练调整权向量的算法,实验结果表明其在语音识别中具有很好的性能·  相似文献   

2.
连续型隐马尔可夫模型(HMM)参数与语音识别   总被引:1,自引:0,他引:1  
提出了一种新的连续型隐马尔可夫模型(HMM)的概率密度函数,并导出了一系列的参数寻优迭代公式,与常用的概率密度函数相比,它的运算量较小,且不易产生计算时的上溢与溢问题,把它用于HMM语音识别,效果较好。  相似文献   

3.
提出了一种改进隐马尔可夫模型(HMM)的方法,即把遗传算法应用到Baum-Welch算法B值的优化当中,解决了Baum-Welch算法容易陷入局部最优解的缺点,得到了全局最优解,提高了语音识别系统的识别率。  相似文献   

4.
基于CDHMM/SOFMNN噪声背景下的语音识别方法   总被引:2,自引:0,他引:2  
针对噪声背景下传统语音识别系统识别率较低的问题,提出了一种将自组织特征映射神经网络(SOFMNN)与隐马尔可夫模型(HMM)相结合的方法,训练出适应噪声的混合模型.该模型适合于对噪声背景下的语音进行识别.同传统的CDHMM模型以及直接在语音中加入加性噪声训练出的CDHMM模型相比,该模型具有更好的抗噪鲁棒性,在信噪比较低的情况下(2~12 dB),识别率比传统CDHMM模型有明显提高.  相似文献   

5.
提出一种结合SOFM失真的HMM语音识别方法,它直接将SOFM失真测度与左右型离散HMM相结合综合利用SOFM失真五HMM状态输出概率作为HMM的匹配失真测度。该方法既可以看作为基于VQ失真语音识别方法的推广,又可以看作为半连续HMM的一种特例。实验结果证明它具有良好的效果。  相似文献   

6.
噪声环境中基于HMM模型的语音信号端点检测方法   总被引:8,自引:1,他引:8  
在噪声环境下如何提高语音信号端点检测的准确性是自动语音识别(ASR)研究中的一个重要课题.常用的基于短时能量的端点检测方法对于能量较低的音节或在信噪比较低的环境下,检测性能不够理想.讨论了一种基于HMM模型的语音信号端点检测方法.先用训练的方法生成背景噪声和废料的模型,再用Viterbi解码算法对待测信号进行处理,并给出了具体的实现方法.实验测试结果表明,基于HMM的端点检测方法的检测性能接近于人工检测,方法是有效的.  相似文献   

7.
该文讨论了神经网络语音识别系统中的KohonenSOFM神经网络的矢量量化(VQ)的原理与过程,着重解决了其在实际应用时的若干问题,包括网络大小,学习步幅函数以及矢量量化过程中的公平竞争学习的控制函数的选定。过讨论了基于听觉模型的声学特性的提取与处理,这与VQ性能息息相关。系统应用的实验表明,该神经网络在语音识别系统中具有良好性能。  相似文献   

8.
本文针对线性模型在语音识别中的不足,进行了隐马尔可夫模型(HMM)在语音单字识别中的研究,主要对观察输出概率求解、最佳状态序列寻找、参数估计和模型参数的选择进行了探讨.  相似文献   

9.
基于话者分类和HMM的话者自适应语音识别   总被引:2,自引:1,他引:2  
本文提出了一种基于话者分类和HMM的话者自适应语音识别方法,采用对参考话者聚类、并按话者类分别建立HMM模板的策略,对于新注册的用户,系统只需利用其极少量的语音,便可将与之最相近的一类模板指派给新用户,再采用基于谱空间映射的两级自适应方法,使系统自适应到用户的模式下工作.这种方法既提高了识别性能,又降低了自适应的难度,还有利于HMM的建立.讨论了话者分类数和自适应语音数据对话者自适应效果及识别性能的影响,提出了一种在自适应语音数据不足情况下仍具有较好自适应效果的基于FVQ的码本自适应改进算法,该算法还具有对自适应字表不敏感的特点.  相似文献   

10.
提出了一个用于乐器识别的听觉仿生系统.该系统基于人类听觉系统中对声源识别起关键作用的耳蜗基底膜、内毛细胞、耳蜗核等部位的生理学功能设计出听觉仿生系统,并对乐器特征进行了提取,进而建立模拟听皮层功能的自组织特征映射神经网络,对构建的由7种乐器243个独奏乐曲样本组成的乐器数据库进行分类识别,乐器识别正确率在75%以上.  相似文献   

11.
语音识别中隐马尔可夫模型状态数的研究   总被引:2,自引:0,他引:2  
该文从信息论的观点出发,对语音信号的隐马尔可夫模型(HMM)的状态数进行研究,建立了HMM的状态数研究的简化模型,指出HMM的信息熵是由语音信号的固有熵和附加熵组成。随状态数增加,信息熵趋向固有熵。最后,在综合考虑信息熵和运算量两方面因素情况下,得出了状态数宜在6 ̄8之间的结论。  相似文献   

12.
基于BPNN/HMM神经网络的声学模型研究   总被引:1,自引:0,他引:1  
研制了一种基于BP神经网络和隐马尔可夫模型(HMM)的混合声学模型,BP神经网络的主要功能是把失真语音特征矢量转换成纯净语音特征矢量,而删则对转换后的纯净语音特征矢量进行分类,从模型级补偿的方面来提高语音识别系统的鲁棒性.讨论了一种基于线性预测的MKCC语音特征提取方法,该方法把提取出的失真语音特征矢量作为神经网络的输入,从而实现了特征参数级去噪处理的目的.  相似文献   

13.
基于改进的隐马尔科夫模型的语音识别方法   总被引:1,自引:0,他引:1  
针对隐马尔可夫(HMM)语音识别模型状态输出独立同分布等与语音实际特性不够协调的假设以及在使用段长信息时存在的缺陷,对隐马尔可夫模型进行改进,提出马尔可夫族模型。马尔可夫族模型可看作一个数学上由多个马尔可夫链构成的多重随机过程,HMM模型则是双重随机过程,因而,HMM模型可视为马尔可夫族模型的特例。马尔可夫族模型用条件独立性假设取代了HMM模型的独立性假设。相对条件独立性假设,独立性假设是过强假设,因而,基于马尔可夫族模型的语音模型更符合语音实际物理过程。在马尔可夫族语音识别模型中引入状态段长信息,能自动根据语速对语音单元段长进行调整。非特定人连续语音实验结果表明,利用状态段长信息的改进语音识别模型比经典HMM模型的性能明显提高。  相似文献   

14.
基于HMM的孤立字识别   总被引:1,自引:0,他引:1  
本文以HMM(隐马尔可夫模型)为基础研究孤立字的汉语语音识别。孤立字的汉语语音样本首先经过人工切分去除寂静段,然后进行分帧处理;对每一帧语音进行频域预加重和时域汉明窗加权处理后,提取该帧的39维的MFCC混合参数(Mel频率倒谱参数);把该字所有帧的MFCC混合参数作为该字HMM模型的观察序列对其进行训练。通过在小人群范围内对0-9这十个孤立数码语音的大量实验,得到了很好的识别效果。  相似文献   

15.
为了提高在噪声环境下语音识别系统的性能,对基于子带独立感知理论的语音识别方法进行了研究.这些方法利用人耳对不同频率信号感知的差异,以及噪声和识别对象的频域特征差异,分别采用线性分析、判决分析、多层感知机以及子带最大似然估计对噪声影响进行补偿.实验表明,子带分析采用非线性策略优于线性策略.基于独立感知假定的子带模型,虽然由于独立性假定丢失了带间相关性,但对于噪声环境下语音识别而言可以捕获噪声和识别对象的频谱差异,从而获得比全带分析更高的鲁棒性.  相似文献   

16.
传统的隐马尔可夫模型的缺点在于不能很好地描述语音信号的动态特性。某些改进算法状态持续时间进行修正,但是也削弱了对实时信号长度变化的适应性。作者在传统的隐马尔夫模型的基础上,通过在引入状态持续时间时,将其归一化。并观察序列长度对它的影响,使之能较好地描述语音信号的动态特性,同时也能较好地自适应描述实时语音信号的长度变化。  相似文献   

17.
利用可穿戴式加速度传感器采集手势动作信息,研究了基于隐马尔可夫模型的手势识别技术.首先采集手势加速度数据,采用改进的SWAB算法进行自动端点检测,通过提取相应的手势特征,利用HMM对手势指令建模,并采用K-means算法矢量量化手势特征序列,以提高手势识别性能.实验表明,本文采用的方法能够有效识别手势动作.  相似文献   

18.
介绍了基于隐马尔可夫模型(HMM)技术的语音识别原理,以航行信号灯的控制为例,提出了孤立词语音识别技术应用于船舶智能控制的方法.采用C++编程和语音识别工具箱HTK相结合的方法进行软件设计,然后以数字信号处理(DSP)芯片TMS320C5409为主完成硬件设计,实验结果表明该控制方法的正确识别率达到98 %以上,具有一定的可行性.  相似文献   

19.
连接数字串语音识别   总被引:2,自引:0,他引:2  
 介绍了语音识别的一般方法,基于隐马尔可夫 (HMM )统计模型和HTK工具包,声学层选用单音子和二音子识别单元,给出了一个简单的,母语为非汉语的非特定人连接数字串识别实验.  相似文献   

20.
本文提出了一种基于模糊矢量量化(FVQ)和隐马尔柯夫模型(HMM)模糊训练的语音识别新方法.利用模糊矢量量化替代了传统方法中的矢量量化,语音特征参数序列经过模糊矢量量化后得到模糊观察符号序列.在此基础上提取出一个反映训练样本总体随机变化特性的模糊观察符号序列,然后用它对该音节的HMM进行一次性全局训练,训练算法经传统的Baum-Welch算法改进得到.经十个汉语数字的对比实验表明,该训练算法大大提高了系统的训练速度,模糊矢量量化与传统的矢量量化相比,不仅提高了隐马尔柯夫模型的鲁棒性,进而提高了系统的识别率,而且在语音训练数据不充足的情况下,也能得到很好的识别性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号