首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
噪声环境中基于HMM模型的语音信号端点检测方法   总被引:8,自引:1,他引:8  
在噪声环境下如何提高语音信号端点检测的准确性是自动语音识别(ASR)研究中的一个重要课题.常用的基于短时能量的端点检测方法对于能量较低的音节或在信噪比较低的环境下,检测性能不够理想.讨论了一种基于HMM模型的语音信号端点检测方法.先用训练的方法生成背景噪声和废料的模型,再用Viterbi解码算法对待测信号进行处理,并给出了具体的实现方法.实验测试结果表明,基于HMM的端点检测方法的检测性能接近于人工检测,方法是有效的.  相似文献   

2.
隐Markov模型中状态停留时间的模型化   总被引:4,自引:0,他引:4  
在用传统的HMM(THMM)刻画现实中的语音时有一个显然的缺点,那便是它不能合适地表征语音信号的时域结构。本文采用依赖于时间的状态转移概率来模型化状态停留时间,修改后的模型称为MHMM。对于参加过训练的说话人,THMM和MHMM的正识率基本上差不多。而对于未参加过训练的说话人,MHMM的正识率明显高于THMM的正识率。也就是说,MHMM对于说话人的适应性要好于THMM。原因在于MHMM更多地包含了发音时音素间的跳转信息。  相似文献   

3.
基于信息熵贴近度的旋转机械故障诊断   总被引:7,自引:1,他引:6  
基于信息融合的思想,研究了反映振动能量的旋转机械故障状态的各种信息熵特征,如奇异谱熵、功率谱熵、小波空间状态特征谱熵和小波能谱熵.通过转子试验,给出了旋转机械的不平衡、不对中、支座松动、轴裂纹典型故障下的各信息熵的变化范围.根据越相似的模式间距离越短原理,提出采用贴近度来进行模式识别的方法.首先利用贴近度原理和熵带构建了信息熵贴近度模型,其次计算出待识别状态与各典型故障之间的信息熵贴近度值,则对应于待识别状态之间的信息熵贴近度最大的即为待识别状态的故障模式,最后通过实例描述了基于信息熵贴近度的旋转机械故障诊断方法的可行性.  相似文献   

4.
本文在统一的框架下描述了隐马尔柯夫模型(HMM)用于语音识别时的各种形式,包括离散HMM、连续混合密度HMM、半连续HMM和最大分量连续HMM等,指出各种模型均是统一形式下的导出形式。文中就离散HMM、连续混合密度HMM和最大分量连续HMM在非特定人全音节汉语语音识别中的应用,从识别率和复杂度两方面进行了性能比较。为提高最大分量连续HMM的识别性能;提出了一种修正的训练算法。  相似文献   

5.
根据声道模型与AR模型的对应关系,提出一种可用于神经网络语音识别的新特征———语音信号的全局时频特征,从整体上描述LPC倒谱系数的变化规律.其特点是:(1)特征长度固定,为传统的静态神经网络应用于语音识别创造了良好条件;(2)与其他语音识别系统所用的神经网络相比,新特征极大地降低了神经网络的规模及训练时间;(3)基于新特征的系统的识别性能明显优于传统的HMM方法及GMDS算法.  相似文献   

6.
用于SOM神经网络语音识别的自适应局部搜索算法   总被引:1,自引:0,他引:1  
采用一种基于自组织特征映射(SOM)神经网络和隐马尔柯夫模型(HMM)法结合的语音识别方法.根据语音信号的相关性,提出了一种自适应局部搜索算法.结果表明,该算法相对于全搜索算法而言,计算量小而又不降低识别率  相似文献   

7.
基于Hilbert谱熵的柴油机故障诊断方法研究   总被引:1,自引:0,他引:1  
从信号的特征提取出发,采用局域波时频谱分析和信息熵结合的方法--Hilbert谱熵(HSE),进行柴油机振动信号的特征提取和状态识别.首先,对信号进行局域波分解;然后,根据得到的内蕴模式分量计算Hilbert谱;最后,建立基于时频分布的Hilbert谱熵,并以此作为故障识别的特征参数.以柴油机缸套与活塞间磨损的状态识别为例,根据对时域、频域和时频域的信息熵比较分析,证明了Hilbert谱熵对柴油机的状态进行评价的有效性.此方法为柴油机预知维修提供了一个有效的手段.  相似文献   

8.
利用基因算法训练连续隐马尔柯夫模型的语音识别   总被引:2,自引:0,他引:2  
为了提高语音识别系统的性能,基于全域优化的思想,提出了一种用于训练连续隐马尔柯夫模型(CHMM)的新算法——基因算法,并将该算法用于语音识别.用该算法训练CHMM,可得到最佳的模型参数,从而提高了语音识别率.利用该算法训练CHMM,不需要对CHMM的每一个参数单独进行估值,能够在一定的程度上提高训练速度.文中阐述了整个算法,给出了计算机模拟结果,并与传统的训练方法进行了比较.  相似文献   

9.
摘要: 将描述单元化制造系统状态所需信息量分为结构熵和运行熵2种形式并予以定义;在信息熵理论基础上,构建了单元化制造系统的结构熵与运行熵函数,并对制造资源的状态认定进行说明;根据调度理论,分别建立最大可能调度时限和调度符合度模型.以实施单元化制造的某加工车间为背景,依据其在不同状态下制造资源的状态信息,实证分析并绘制了系统状态随调度变化的示意图,利用所建熵函数及调度模型对系统状态进行度量,以验证所提出方法的科学性与有效性.结果表明,通过所构建的信息熵模型,可实现对单元化制造系统状态的度量与监控,并为提高系统的运行效率提供有效途径.  相似文献   

10.
研究了用于CHMM的MCE学习方法,提出了简单形式的识别函数、误差函数、扣池数等的定义方法以及总损失函数的最小化方法。通过对非特定人汉语连续语音识别实验,证明了提出了的函数形式和损失函数最小化方法对CHMM的MCE学习的有效性。  相似文献   

11.
基于改进的隐马尔科夫模型的语音识别方法   总被引:1,自引:0,他引:1  
针对隐马尔可夫(HMM)语音识别模型状态输出独立同分布等与语音实际特性不够协调的假设以及在使用段长信息时存在的缺陷,对隐马尔可夫模型进行改进,提出马尔可夫族模型。马尔可夫族模型可看作一个数学上由多个马尔可夫链构成的多重随机过程,HMM模型则是双重随机过程,因而,HMM模型可视为马尔可夫族模型的特例。马尔可夫族模型用条件独立性假设取代了HMM模型的独立性假设。相对条件独立性假设,独立性假设是过强假设,因而,基于马尔可夫族模型的语音模型更符合语音实际物理过程。在马尔可夫族语音识别模型中引入状态段长信息,能自动根据语速对语音单元段长进行调整。非特定人连续语音实验结果表明,利用状态段长信息的改进语音识别模型比经典HMM模型的性能明显提高。  相似文献   

12.
基于人耳听觉特性提出一种新的抗噪音识别特征:加权组合过零峰值幅度特征,是对过零峰值幅度特征的一种改进。加权组合过零峰值幅度特征以语音数据和差分语音数据作为处理对象,通过计算它们的上升过零率获得频率信息,经幅度非线性压缩获得密度信息,并根据人耳对声音的感知特点对其进行加权,形成最终的输出特征,识别网络使用HMM。仿真实现了使用新特征与原特征的算法识别结果,证明了新特征具有较高的识别率和优良的抗噪性能。  相似文献   

13.
针对传统的 HMM 模型中状态持续时间不长的不足,且在计算量大的情况下,语音识别精度不高,训练时间长,训练误差较高,提出了一种基于语音状态持续时间长的 HMM 模型。 首先,令状态转移矩阵的对角线元素全为 0,去掉自转移弧,再增添以参数化的函数描述持续时间的高斯分布,再通过帧与帧相互 之间的关联程度,将每帧都计算进去;其次,通过重估公式反复计算每条弧被指定的转变概率和可见符号序列输出最原始的数值概率,直至收敛,停止运算。 最后,在 HMM 模型改进前后实验中得到更小的训练误差,下降速度更快,计算量较之前减少多,更容易达到收敛,其概率输出与它前面一个概率输出的差值与该概率 输出值的比值大于 HMM 模型设定的初始值。 与传统 HMM 模型实验比较,基于持续时间状态的 HMM 模型可以在一定程度上降低训练次数和训练时间,提高识别语音的精确度,基本完成了语音识别系统的功能。  相似文献   

14.
一种基于信息熵的语音端点检测方法   总被引:8,自引:0,他引:8  
根据语音信号的波形特征,利用熵函数的性质,构造了一种特殊的熵函数,通过判断此函数值和大小,确定是语音还是无声状态,实验表明,此方法计算简单而且具有很高的准确性。  相似文献   

15.
普米语是一种无文字的少数民族语言,目前已处于濒危状态,建立语音语料库及开展语音识别研究是保护和传承普米语的重要手段.基于HTK的语音识别中,参数的选取对不同语言的识别率有很大的影响.针对MFCC维数、HMM状态数及GMM个数这3个参数对普米语的识别率进行研究,结果表明:普米语语音识别的最佳MFCC维数为13维,最佳HMM状态数为8个,最佳GMM个数为3个.  相似文献   

16.
基于状态驻留时间的汉语语音分段概率模型   总被引:1,自引:0,他引:1  
为了解决分段概率模型 (SPM)因缺少对时间信息描述而带来的建模精度低的问题 ,提出了状态驻留分段概率模型 (SDSPM)。SDSPM中包含了用伽玛分布表示的状态驻留概率 ,以刻划语音的时间特征。此驻留概率相当于隐马尔可夫模型 (HMM)中的状态转移概率 ,但使 SDSPM描述语音时间特征的能力强于 HMM。SDSPM既改善了 SPM的模型性能 ,同时又避免了 HMM的计算复杂度问题。测试实验证明了 SDSPM模型在汉语语音识别中的有效性。  相似文献   

17.
为提高噪声不平稳或不可估的情况下语音识别的稳健性,提出了利用自回归模型和短时平稳性假设,估计干净与噪声环境的语音数据,建立相应的语音识别模型,以达到抗噪效果的稳健语音信号处理方法。在N o iseX-92的4种噪声环境(w h ite,babb le,vo lvo,destroyer eng ine)从0到20 dB的不同信噪比下的“863”大词汇连续语音标准数据库的平均识别结果表明,该方法能够使得基于段长分布的隐M arkov模型的语音识别系统在25候选时声学层的音节相对错误率下降达到10.85%以下,同时相对正确识别率上升12.13%。  相似文献   

18.
参数共享是基于隐 Markov模型 (hidden Markovmodel,HMM)的语音识别系统的参数训练中的一个关键性问题 ,因此在语音识别的诸多领域中都有重要的应用。对参数共享的作用及其使用的聚类算法进行了分析研究 ,在此基础上提出改进合并分级聚类算法 ,并将其应用于 HMM的状态捆绑。实验表明 ,一个大规模词汇量的孤立词语音识别器采用 HMM的状态捆绑后 ,可以大大缩减识别过程的时空消耗 ,同时识别率仅有较小的损失  相似文献   

19.
介绍了用有限态文法引导的基于连续密度隐马尔可夫模型(HMM)的连续汉语语音识别系统.分析了系统的组成,词语的HMM的训练方法和对识别系统的测试结果。实验表明,用有限态文法辅助进行连续语音识别是一种有效的策略;连续密度HMM与基于矢量量化的HMM/VQ相比需要较大的计算量,但可明显提高识别准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号