首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
抽取短时声学特征参数如MFCC、PLP,使用高斯混合模型(GMM)估计特征参数对应音素的概率分布的隐马尔可夫模型(HMM)在大词汇连续语音识别系统(LVCSR)已取得了良好识别效果.但短时特征却不能有效反应连续帧之间的相关特性,因此运用神经网络多层感知器(MLP)产生两类差异特征用于描述该帧的音素后验概率,并将其与传统特征复合为新的特征参数流,利用新特征流对GMHMM模型进行重构.对比实验结果表明,采用该混合声学特征的LVCSR系统其错字率(CER)有了3%~7%的改善.  相似文献   

2.
提出了一种利用动态数量高斯分量拟合不同音素,利用拟合的音素组合作为补白参与语音关键词识别系统二次判决的方法.首先分析了为音素分配动态的高斯分量数量来训练音素模型的可行性;进而寻找能够准确描述音素且保证描述在不同音素之间有足够区分度的高斯分量个数;利用得到的音素与高斯分量数量的关系训练动态高斯添加的音素隐马尔科夫模型,利用模型的排列组合作为补白为语音关键词识别系统添加第二次判决来减小系统错误识别率.实验表明,利用这种方法进行语音关键词系统二次判断,能将原系统错误率降低至14.79%.  相似文献   

3.
针对传统的 HMM 模型中状态持续时间不长的不足,且在计算量大的情况下,语音识别精度不高,训练时间长,训练误差较高,提出了一种基于语音状态持续时间长的 HMM 模型。 首先,令状态转移矩阵的对角线元素全为 0,去掉自转移弧,再增添以参数化的函数描述持续时间的高斯分布,再通过帧与帧相互 之间的关联程度,将每帧都计算进去;其次,通过重估公式反复计算每条弧被指定的转变概率和可见符号序列输出最原始的数值概率,直至收敛,停止运算。 最后,在 HMM 模型改进前后实验中得到更小的训练误差,下降速度更快,计算量较之前减少多,更容易达到收敛,其概率输出与它前面一个概率输出的差值与该概率 输出值的比值大于 HMM 模型设定的初始值。 与传统 HMM 模型实验比较,基于持续时间状态的 HMM 模型可以在一定程度上降低训练次数和训练时间,提高识别语音的精确度,基本完成了语音识别系统的功能。  相似文献   

4.
针对目前动态手势识别中隐马尔可夫模型(HMM)在训练B参数的过程中,训练过程复杂、易陷入局部最优解的不足,提出了一种基于B参数的改进HMM动态手势识别算法.该算法在计算HMM观测状态转移概率的过程中,引入了支持向量机(SVM)改进算法,利用SVM的强分类能力将其输出通过Sigmoid函数转换为概率,并作为HMM中各个隐状态的输出概率,优化了HMM的B参数,从而改进了HMM算法的性能,提高了系统的识别率.实验结果证明:该方法能够准确地识别出动态手势轨迹,平均识别率由86.1%提高到97.4%,并且对光照和复杂背景均具有较强的鲁棒性.  相似文献   

5.
基于状态驻留时间的汉语语音分段概率模型   总被引:1,自引:0,他引:1  
为了解决分段概率模型 (SPM)因缺少对时间信息描述而带来的建模精度低的问题 ,提出了状态驻留分段概率模型 (SDSPM)。SDSPM中包含了用伽玛分布表示的状态驻留概率 ,以刻划语音的时间特征。此驻留概率相当于隐马尔可夫模型 (HMM)中的状态转移概率 ,但使 SDSPM描述语音时间特征的能力强于 HMM。SDSPM既改善了 SPM的模型性能 ,同时又避免了 HMM的计算复杂度问题。测试实验证明了 SDSPM模型在汉语语音识别中的有效性。  相似文献   

6.
本文用多码本结构的HMM进行汉语语音识别。语音特征有Cep(倒频谱)系数及其一阶差分ΔCep。建立特征矢量Cep1、Cep2和ΔCep1的三个VQ码本,分别训练出三个HMM模型。实验结果表明此方法优于以LPC为特征参数的单码本HMM方法。由于增强了辅音的特征,对易于混淆的孤立字语音取得90%的识别率。对二字词组语音的识别率为98%。  相似文献   

7.
介绍了用有限态文法引导的基于连续密度隐马尔可夫模型(HMM)的连续汉语语音识别系统.分析了系统的组成,词语的HMM的训练方法和对识别系统的测试结果。实验表明,用有限态文法辅助进行连续语音识别是一种有效的策略;连续密度HMM与基于矢量量化的HMM/VQ相比需要较大的计算量,但可明显提高识别准确率。  相似文献   

8.
介绍了语音变换的相关技术,分析了利用正弦谐波模型实现语音变换的算法及流程。利用正弦谐波模型对语音进行建模和分解,提取语音的基音频率,利用高斯建模和变换实现语音韵律特征的变换;提取出正弦谐波幅度的后10阶系数,作为语音的频谱特征参数,利用矢量量化和码书映射的方法实现语音频谱特征的变换。提出了一种逐词对应的训练参数对齐方法,给出了具体实现的算法流程。对录制的2段语音利用该算法进行了仿真实验,利用ABX测试对实验结果进行了评估。测试结果显示,该算法得到的变换语音在听觉上有89.3%的概率更接近目标说话人语音。  相似文献   

9.
提出了一种基于混合高斯模型的隐马尔科夫模型(GMM-HMM)与手势轮廓特征的单幅手势图像识别方法,该方法采用YCr Cb空间阈值处理对手势图像二值化处理,针对理想感兴趣区域提出了一种还原最上层轮廓的新型轮廓算法.将每类手势轮廓特征作为HMM的观察值分别训练对应手势的HMM参数,建立所有手势的HMM模型.分别用Viterbi算法计算测试集数据与每个模型的条件概率来获得识别结果.实验结果表明,该方法不仅对手势库内的特定人的静态手势识别具有较好的效果,且对提取的其他人的静态手势图像识别率也较高.  相似文献   

10.
采用传统的高斯混合模型(Gaussian mixture model,GMM)进行语音带宽扩展时,会出现所估计的特征参数过平滑的问题,其主要原因是协方差估计不准确而导致扩展的高频特征细节信息的丢失,因此本文提出了码本映射(codebook mapping,CM)与高斯混合模型相结合的语音带宽扩展算法.提取高、低频特征参数,并训练高斯混合模型,基于高斯混合模型参数训练偏移矢量的码本;在扩展阶段,利用偏移矢量的码本将低频偏移矢量映射为高频偏移矢量,再将高频偏移矢量与高斯混合模型估计部分相加作为估计的高频特征参数.对利用该方法进行带宽扩展后的语音质量进行主观/客观评测.实验结果表明,相比传统的GMM语音带宽方法,CM-GMM合成的高频语音更接近原始高频语音,明显消除了高频过平滑现象.   相似文献   

11.
提出一种基于二阶隐马尔可夫模型(HMM)的新闻分类算法,旨在提取新闻内容中的类别字,构成特征词集合.以该特征词集合作为不同二阶HMM分类器的观察序列,二阶HMM的隐藏状态反映了文档中词语之间的相关性差异,每个状态表示出现在语料库中的词语的相关性水平.实验结果表明,相比k近邻(k NN)、朴素贝叶斯(Naive Bayes)以及支持向量机(SVM)算法,二阶HMM算法的分类表现更显优势.  相似文献   

12.
在假定隐藏的马氏链为非齐次且从隐藏链到观测链的转移矩阵列也与时刻n有关的情况下,对一类在发音过程中常用的隐马尔可夫模型进行研究.这类模型的主要特点是观测链不仅受当前状态的影响还与上一时刻的状态有关.先给出了该模型的强极限定律,然后得出了状态出现频率的强极根定理.  相似文献   

13.
针对隐马尔可夫(HMM)词性标注模型状态输出独立同分布等与语言实际特性不够协调的假设,对隐马尔可夫模型进行改进,引入马尔可夫族模型。,该模型用条件独立性假设取代HMM模型的独立性假设。将马尔可夫族模型应用于词性标注,并结合句法分析进行词性标注。用改进的隐马尔可夫模型进行词性标注实验。实验结果表明:与条件独立性假设相比,独立性假设是过强假设,因而基于马尔可夫族模型的语言模型更符合语言等实际物理过程;在相同的测试条件下,马尔可夫族模型明显好于隐马尔可夫模型,词性标注准确率从94.642%提高到97.126%。  相似文献   

14.
连续型隐马尔可夫模型(HMM)参数与语音识别   总被引:1,自引:0,他引:1  
提出了一种新的连续型隐马尔可夫模型(HMM)的概率密度函数,并导出了一系列的参数寻优迭代公式,与常用的概率密度函数相比,它的运算量较小,且不易产生计算时的上溢与溢问题,把它用于HMM语音识别,效果较好。  相似文献   

15.
针对广播音频语种识别中与语种识别无关的特征对识别结果产生影响的问题, 提出一种基于伽马频率倒谱系数的改进特征参数的语种识别方法. 通过提取每帧信号的能量谱包络, 去除部分与说话人相关的特征, 采用Gammatone滤波器组滤波, 经离散余弦变换后再进行倒谱提升, 得到改进的伽马频率倒谱系数特征参数. 将广播音频信号提取特征参数输入隐Markov模型中进行训练测试, 得到的语种识别结果表明, 该方法有效提升了广播音频语种识别的准确率, 优于目前使用的伽马频率倒谱系数特征及其衍生方法.  相似文献   

16.
提出一种混合模型,即将隐马尔可夫模型(HMM)和小波神经网络(WNN)相结合应用于说话人识别的模型.该方法利用HMM的时序建模能力以及小波神经网络较强的模式分类能力,进行与文本无关的说话人的识别.实验表明,采用这种混合模型可以提高系统的识别率,特别在噪声环境中具有一定的噪声鲁棒性,提高了识别性能.  相似文献   

17.
基于广义隐马尔可夫模型的网页信息抽取方法   总被引:2,自引:0,他引:2  
针对网页所特有的基于版面结构的特点,利用基于视觉的网页分割算法VIPS对网页分块,得到一种新的状态转移序列,取代了传统的状态转移序列。通过二阶Markov链改进广义隐马尔可夫模型(GHMM)的状态转移和输出观测值假设条件,提出了二阶的广义隐马尔可夫模型。最后通过实验说明改进的GHMM对于网页信息抽取有很高的精确率。  相似文献   

18.
在非时齐马氏决策过程中的动态贝叶斯网络研究   总被引:3,自引:0,他引:3  
提出了用动态贝叶斯网络(DBN)对非时齐马氏决策系统进行建模的改进方法,使动态贝叶斯网络能被更广泛地应用于各种复杂的真实系统中.该方法的基本思路是,将扩展后的隐藏变量引入DBN的演化过程来建立假设条件所要求的马尔可夫模型,给出从不完整的样本数据集以及存在隐藏变量时来学习DBN结构的算法,进而用贝叶斯概率统计方法对后来的时间片的充分统计因子进行估计,并通过当前已存在的和估计的充分统计因子对基于时间变化的转移概率进行学习,以解决假设条件要求的转移概率的时不变性.原理性分析和仿真实验结果也验证了改进方法的有效性.  相似文献   

19.
一种改进的隐马尔可夫模型训练算法   总被引:2,自引:0,他引:2  
将类关联特征(class-dependent feature,CDF)用于隐马尔可夫模型(hidden Markov model,HMM)的建模,提出了一种新的HMM训练算法,与传统的HMM训练算法在理论上完全一致,但新算法避免了直接估计高维的状态输出概率密度函数(probability density function,PDF),可提高模型参数的估计精度.  相似文献   

20.
一类隐马尔可夫模型的若干极限性质   总被引:4,自引:0,他引:4  
假定隐藏的马尔可夫链为非齐次,研究隐非齐次马尔可夫模型的一些强极限定理.首先在引理中得出了隐非齐次马尔可夫模型的一些性质,从而导出了隐非齐次马尔可夫模型的三元函数一类平均值的强极限定理.作为定理的推论,得到了隐非齐次马尔可夫模型状态出现频率的一类强极限定理.隐马尔可夫模型可应用于弱相依随机变量的建模上,也可用作研究发音过程、神经生理学与生物遗传等方面的工具.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号