首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
针对隐马尔可夫(HMM)词性标注模型状态输出独立同分布等与语言实际特性不够协调的假设,对隐马尔可夫模型进行改进,引入马尔可夫族模型。,该模型用条件独立性假设取代HMM模型的独立性假设。将马尔可夫族模型应用于词性标注,并结合句法分析进行词性标注。用改进的隐马尔可夫模型进行词性标注实验。实验结果表明:与条件独立性假设相比,独立性假设是过强假设,因而基于马尔可夫族模型的语言模型更符合语言等实际物理过程;在相同的测试条件下,马尔可夫族模型明显好于隐马尔可夫模型,词性标注准确率从94.642%提高到97.126%。  相似文献   

2.
本文针对线性模型在语音识别中的不足,进行了隐马尔可夫模型(HMM)在语音单字识别中的研究,主要对观察输出概率求解、最佳状态序列寻找、参数估计和模型参数的选择进行了探讨.  相似文献   

3.
基于离散隐马尔科夫模型的语音识别技术   总被引:1,自引:0,他引:1  
概述语音识别技术的基本原理,对当前三种主要识别技术--动态时间规整技术、隐含马尔科夫模型技术及人工神经网络技术进行比较,重点介绍基于离散隐马尔科夫模型(DHMM)的语音识别系统的实现.  相似文献   

4.
连续型隐马尔可夫模型(HMM)参数与语音识别   总被引:1,自引:0,他引:1  
提出了一种新的连续型隐马尔可夫模型(HMM)的概率密度函数,并导出了一系列的参数寻优迭代公式,与常用的概率密度函数相比,它的运算量较小,且不易产生计算时的上溢与溢问题,把它用于HMM语音识别,效果较好。  相似文献   

5.
语音识别中隐马尔可夫模型状态数的研究   总被引:2,自引:0,他引:2  
该文从信息论的观点出发,对语音信号的隐马尔可夫模型(HMM)的状态数进行研究,建立了HMM的状态数研究的简化模型,指出HMM的信息熵是由语音信号的固有熵和附加熵组成。随状态数增加,信息熵趋向固有熵。最后,在综合考虑信息熵和运算量两方面因素情况下,得出了状态数宜在6 ̄8之间的结论。  相似文献   

6.
利用段长信息的改进连续语音识别算法   总被引:1,自引:1,他引:1  
以基于段长分布的隐含Markov模型为基础,提出了一种改进的帧同步束搜索连续语音识别算法,使段长信息在连续语音识别中得到充分有效的利用,并与原算法作了比较。在该算法的具体实现上,建立了状态的局部路径组和全局活跃路径两种数据结构,并采用了帧同步快速实时算法来处理局部路径的剪枝和跳转。说明了段长参数的估计方法。介绍了非特定人大词汇量连续语音识别的实验,实验结果表明,利用段长信息改进识别算法比原识别算法字的误识率降低了6%。  相似文献   

7.
传统的隐马尔可夫模型的缺点在于不能很好地描述语音信号的动态特性。某些改进算法状态持续时间进行修正,但是也削弱了对实时信号长度变化的适应性。作者在传统的隐马尔夫模型的基础上,通过在引入状态持续时间时,将其归一化。并观察序列长度对它的影响,使之能较好地描述语音信号的动态特性,同时也能较好地自适应描述实时语音信号的长度变化。  相似文献   

8.
提出了一种改进隐马尔可夫模型(HMM)的方法,即把遗传算法应用到Baum-Welch算法B值的优化当中,解决了Baum-Welch算法容易陷入局部最优解的缺点,得到了全局最优解,提高了语音识别系统的识别率。  相似文献   

9.
噪声环境中基于HMM模型的语音信号端点检测方法   总被引:8,自引:1,他引:8  
在噪声环境下如何提高语音信号端点检测的准确性是自动语音识别(ASR)研究中的一个重要课题.常用的基于短时能量的端点检测方法对于能量较低的音节或在信噪比较低的环境下,检测性能不够理想.讨论了一种基于HMM模型的语音信号端点检测方法.先用训练的方法生成背景噪声和废料的模型,再用Viterbi解码算法对待测信号进行处理,并给出了具体的实现方法.实验测试结果表明,基于HMM的端点检测方法的检测性能接近于人工检测,方法是有效的.  相似文献   

10.
基于ZCPA和DHMM的孤立词语音识别系统   总被引:2,自引:0,他引:2  
介绍了用离散隐马尔可夫模型(DHMM)构造孤立词语音识别系统的过程,重点针对软件实现中的问题重新推导了Baum Welch算法的重估公式,引入一种抗噪性能很好的特征参数:过零率与峰值幅度特征,将该特征与DHMM结合用于孤立词识别系统。结果表明,此系统训练时收敛很快并且识别效果好。  相似文献   

11.
基于隐马尔可夫模型与并行模型组合的特征补偿算法   总被引:1,自引:0,他引:1  
提出了一种基于隐马尔可夫模型和并行模型组合的特征补偿算法.首先,利用一个包含较多状态的隐马尔可夫模型来描述全部单词特征向量的分布.然后,根据静音段估计的噪声均值和方差,采用并行模型组合方法调整隐马尔可夫模型的均值向量和协方差矩阵,使之与识别环境相匹配.最后,根据基于状态转移矩阵压缩的前向后向算法计算隐马尔可夫模型的后验概率,并通过最小均方误差准则估计纯净语音特征向量.实验结果表明,该算法能够更加准确地估计纯净语音特征向量,其性能明显优于基于高斯混合模型的特征补偿算法;状态转移矩阵压缩算法可以在不影响补偿精度的前提下,显著减少前向后向算法的计算量.  相似文献   

12.
为了提高在噪声环境下语音识别系统的性能,对基于子带独立感知理论的语音识别方法进行了研究.这些方法利用人耳对不同频率信号感知的差异,以及噪声和识别对象的频域特征差异,分别采用线性分析、判决分析、多层感知机以及子带最大似然估计对噪声影响进行补偿.实验表明,子带分析采用非线性策略优于线性策略.基于独立感知假定的子带模型,虽然由于独立性假定丢失了带间相关性,但对于噪声环境下语音识别而言可以捕获噪声和识别对象的频谱差异,从而获得比全带分析更高的鲁棒性.  相似文献   

13.
隐Markov模型在剪接位点识别中的应用   总被引:6,自引:0,他引:6  
剪接位点的识别是基因识别中的一个重要环节。由于现有的基因识别算法主要关注编码区的整体特性 ,而并不着重考虑个别位点的信息 ,因此难以准确地识别出剪接位点。考虑到剪接位点附近的保守序列的相邻碱基之间应该存在某种相关性 ,利用一阶 Markov链建立了表述这种相关性的模型 ,在此基础之上 ,设计了专门用于剪接拉点识别的隐马氏模型 (HMM)方法。实验结果表明 ,用 HMM描述剪接位点附近序列符合实际情况 ,并且利用这一方法进行剪接位点的识别可以很好地提取位点附近保守序列在边缘分布与条件分布 (转移概率 )上的统计特征。使用该方法对真实剪接位点和虚假剪接位点进行识别 ,识别率均可达 90 %以上。  相似文献   

14.
基于段长分布的隐含Markov模型(DDBHMM)可解决经典隐含Markov模型(HMM)的状态段长指数分布的问题,实现了基于凸性假设的搜索。为解决非齐次模型的搜索算法问题,提出采用混合Gauss分布来拟合非凸段长分布,用子状态拆分的方法来实现非凸段长分布DDBHMM识别算法。在音乐信号识别上的实验表明:该方法在召回率提高1.1%的情况下,使准确率提高约10%。该方法实现了非凸段长分布HMM的识别算法,并且对于其他非凸段长信号具有推广价值。  相似文献   

15.
状态输出概率密度为对角协方差矩阵高斯分布的隐马尔可夫模型(HMM-DG)在帧内特征相关建模方面存在缺陷.本文将因子分析方法与HMM-DG的混合高斯建模相结合,提出了一种具有弹性的帧内特征相关隐马尔可夫模型框架一基于因子分析的隐马尔可夫模型(HMM-FA).并导出了HMM-FA的训练算法.理论分析和仿真实验都表明:在训练数据相同的条件下,HMM-FA的性能优于HMM-DG。  相似文献   

16.
为提高噪声不平稳或不可估的情况下语音识别的稳健性,提出了利用自回归模型和短时平稳性假设,估计干净与噪声环境的语音数据,建立相应的语音识别模型,以达到抗噪效果的稳健语音信号处理方法。在N o iseX-92的4种噪声环境(w h ite,babb le,vo lvo,destroyer eng ine)从0到20 dB的不同信噪比下的“863”大词汇连续语音标准数据库的平均识别结果表明,该方法能够使得基于段长分布的隐M arkov模型的语音识别系统在25候选时声学层的音节相对错误率下降达到10.85%以下,同时相对正确识别率上升12.13%。  相似文献   

17.
针对传统的隐含马尔可夫模型(hidden Markov model,HMM)存在的缺陷,该文提出了一种在识别的后处理阶段使用段长模型的方法,并应用在基于HMM的汉语识别系统上。该方法利用归一化的段长模型对识别系统的解码结果重新打分,比较前后两次算出的分数从而选出更可靠的识别结果。实验表明,通过该方法将段长模型应用在识别过程中,可以显著提高识别系统的性能,大量减少识别结果中的插入错误。数据显示,该方法使识别系统的音节错误率下降了大约10%,识别系统最终的插入错误和删除错误都低于1%。  相似文献   

18.
为了对恐怖事件实现早期预警,通过分析恐怖事件的网络结构,构建了恐怖事件的预测模型。利用隐马尔可夫模型与贝叶斯网络方法,通过分析一些先前发生的事件来预测恐怖分子在未来一段时间可能发动的恐怖活动,实现对相关情报的侦测,预防可能发生的恐怖事件。同时,对完备数据与不完备数据条件下的恐怖事件的预测算法进行分析。结果表明,提出的预测方法与使用监测软件得到的结果相近,验证了隐马尔可夫模型的合理性和贝叶斯网络方法的有效性。不足之处在于,监测过程获取的情报信息较少,一定程度上影响了模型结果的精确度。  相似文献   

19.
基于状态驻留时间的汉语语音分段概率模型   总被引:1,自引:0,他引:1  
为了解决分段概率模型 (SPM)因缺少对时间信息描述而带来的建模精度低的问题 ,提出了状态驻留分段概率模型 (SDSPM)。SDSPM中包含了用伽玛分布表示的状态驻留概率 ,以刻划语音的时间特征。此驻留概率相当于隐马尔可夫模型 (HMM)中的状态转移概率 ,但使 SDSPM描述语音时间特征的能力强于 HMM。SDSPM既改善了 SPM的模型性能 ,同时又避免了 HMM的计算复杂度问题。测试实验证明了 SDSPM模型在汉语语音识别中的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号