首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
隐马尔可夫模型(HMM)广泛应用于说话人识别系统中,主要研究了HMM与自组织人工神经网络(SONN)相结合的混合模型HMMNN,并分析构造了基于HMMNN的说话人识别的系统模型.  相似文献   

2.
以非齐次隐马尔可夫模型(Inhomogeneous Hidden Markov Mode1)出发,用自适应函数链神经网络与非齐次隐马尔可夫模型相结合,训练出适用环境变化的HMM模型,并应用该混合模型进行语音识别.实验结果表明,该模型适合于对噪声背景下的语音进行识别,该模型具有更好的鲁棒性,在信噪比较低的情况下,可以提高识别率.  相似文献   

3.
基于高斯混合模型GMM的说话人识别方法   总被引:1,自引:0,他引:1  
臧晓昱 《科技信息》2006,2(1):21-17
高斯混合模型(GMM)是一种经典的说话人识别算法,本文在实现其算法的同时,主要模拟了不同噪声环境情况下高斯混合模型(GMM)的抗噪声性能,得到了一些有益结论。  相似文献   

4.
基于CDHMM/SOFMNN噪声背景下的语音识别方法   总被引:2,自引:0,他引:2  
针对噪声背景下传统语音识别系统识别率较低的问题,提出了一种将自组织特征映射神经网络(SOFMNN)与隐马尔可夫模型(HMM)相结合的方法,训练出适应噪声的混合模型.该模型适合于对噪声背景下的语音进行识别.同传统的CDHMM模型以及直接在语音中加入加性噪声训练出的CDHMM模型相比,该模型具有更好的抗噪鲁棒性,在信噪比较低的情况下(2~12 dB),识别率比传统CDHMM模型有明显提高.  相似文献   

5.
由于噪声干扰问题,说话人识别算法的效率受到很大影响.为此,在美尔倒谱系数特征提取的基础上,采用半升正弦函数对特征进行修正.采用特征规整、特征弯折和特征映射三种方法对特征进行校对.为提高说话人识别率以及模型的鲁棒性,提出混合BP神经网络与混合高斯模型的方法,将高斯混合模型的概率输出作为神经网络输入,从而获取说话人间的交互信息.试验结果显示,算法的识别率高,抗噪性好.  相似文献   

6.
本文利用主分量神经网络分析法(PCANN)和反向传播神经网络,提出了一种具有较强自适应性和较高识别率的说话人识别方法.在此算法过程中,主分量分析法主要是对语音信号的原始特征作分析以得到更好的特征参数;BP神经网络则是作为一个分类器对说话人进行分类.文章将主分量分析与BP神经网络相结合,提高了识别的正确率,增强了系统抗噪声能力,减少了训练时间和计算量,同时简化了网络结构.  相似文献   

7.
谐波小波样本熵与HMM模型的轴承故障模式识别   总被引:1,自引:0,他引:1  
根据谐波小波分解非平稳振动信号优良特性与隐马尔科夫(HMM)模型的时序模式分类能力,提出了一种基于谐波小波样本熵与HMM模型结合的轴承故障模式识别方法.该方法首先利用谐波小波对轴承各个状态故障信号进行分解,进而由谐波小波三维时频网格图的频率层数特征计算合理的样本熵维数和阈值,依次提取轴承振动信号各层的样本熵构成特征向量序列;然后将序列前120组输入HMM模型中进行训练得到对应故障模型,剩余80组进行测试与识别,通过对比对数似然估计概率输出值确定轴承故障类型.实验通过与BP和RBF神经网络模型进行不同训练组数的正确识别率对比,验证了该组合方法具有识别准确率高,稳定性强的优点.  相似文献   

8.
提出一种改进的最大互信息(MMI)准则函数并把它应用于隐马尔可夫模型(HMM)的参数估计,重新推导了HMM的迭代公式. 该准则函数相对于原来准则函数定义更为合理,能有效利用训练样本集中的鉴别信息,使得训练数据得到充分利用,提高了HMM的性能. 把这种改进的HMM算法应用于面部表情识别,利用改进的光流算法提取面部表情特征向量序列,并利用改进HMM算法和BP神经网络构建了面部表情混合分类器. 实验结果表明了该方法能有效提高面部表情识别率,有效解决HMM参数估计问题.  相似文献   

9.
说话人识别技术是通过判断待识别人语音与预先提取的说话人语音特征是否匹配来鉴别说话人身份的一种生物认证技术,环境噪声是说话人识别技术走向实用化的一个主要障碍.针对噪声环境中说话人识别性能较差的不足,结合小波变换的优点,提出了将小波变换技术与传统的特征参数提取方式相结合的方法.该方法首先对语音信号进行小波分解,在此基础上再对小波系数进行阈值处理,仅保留阈值以上的数据,而后提取相关性不大的传统特征参数进行组合,分别作为说话人识别系统的输入矢量.仿真结果表明:在噪声环境中,说话人识别系统能较好识别出说话人,经过小波变换后再提取特征参数的方法可以得到更高的识别率,大大提高说话人识别系统的识别性能.  相似文献   

10.
一种量子神经网络说话人识别方法   总被引:2,自引:1,他引:1       下载免费PDF全文
针对说话人语音特征空间边界存在模糊性的特点,构建了一种量子神经网络识别分类器,用于说话人识别,以改善存在交叉数据的语音特征参数的分类效果。提出了一种基于人工免疫算法的量子间隔训练方法,以改善传统量子神经网络训练算法的不足。以TIMIT语音库为测试语音,与传统BP网络和基于常规梯度下降量子间隔训练算法的量子神经网络做对比实验。实验证明,算法能有效提高说话人识别系统的识别率,同时与高斯混合模型相比,具有更好的抗噪声性能。  相似文献   

11.
基于HMM/MLFNN混合结构的说话人辨认研究   总被引:3,自引:0,他引:3  
将隐马尔可夫模型与人工神经网络相结合既利用HMM能够较好地描述动态时间序列又ANN静态分类能力强的特点,应用于说话人辨认。本文将一个多层前馈神经网络与HMM相结合构成混合模模型,与以往的方法不同。具有所需训练数据量小,推广性能良好的特点。  相似文献   

12.
隐Markov模型中状态停留时间的模型化   总被引:4,自引:0,他引:4  
在用传统的HMM(THMM)刻画现实中的语音时有一个显然的缺点,那便是它不能合适地表征语音信号的时域结构。本文采用依赖于时间的状态转移概率来模型化状态停留时间,修改后的模型称为MHMM。对于参加过训练的说话人,THMM和MHMM的正识率基本上差不多。而对于未参加过训练的说话人,MHMM的正识率明显高于THMM的正识率。也就是说,MHMM对于说话人的适应性要好于THMM。原因在于MHMM更多地包含了发音时音素间的跳转信息。  相似文献   

13.
A face recognition system based on Support Vector Machine(SVM) and Hidden Markov Model (HMM) has been proposed. The powerful discriminative ability of SVM is combined with the temporal modeling ability of HMM. The output of SVM is moderated to be probability output, which replaces the Mixture of Gauss (MOG) in HMM. Wavelet transformation is used to extract observation vector, which reduces the data dimension and improves the robustness.The hybrid system is compared with pure HMM face recognition method based on ORL face database and Yale face database. Experiments results show that the hybrid method has better performance.  相似文献   

14.
两级决策的开集说话人辨认方法   总被引:10,自引:0,他引:10  
为了减少语音数据量 ,提高处理速度和识别的准确性 ,提出了一种采用公共码本、个人隐 Markov模型 (HMM)和个人拒识阈值进行两级决策来实现开集说话人辨认的新方法。在系统实现时 ,采用了一种改进的语音切分算法来提高输入数据的有效性 ,并将说话人识别和人脸识别融合在一起进行身份验证。实验证明这种融合方法能够有效地降低识别的相等错误率至 1%。  相似文献   

15.
基于小波网模型的区域供热系统负荷预测   总被引:6,自引:0,他引:6  
中国的供热系统运行调节中普遍存在由于系统本身的热惯性等因素导致供热量不能实时跟随需求量调整的问题。将小波网络引入热力过程优化运行,通过综合分析系统运行数据间关系,识别供热系统复杂非线性动态特性,建立区域供热系统热负荷小波预测模型。仿真实验表明,该方法在网络规模和预测精度上优于常规多层前馈神经网络。实际运行预测结果表明,该方法辨识精度高,实时性强。  相似文献   

16.
提出了一种新的语音识别方法,该方法综合了VQ,HMM和无教师说话人自适应算法的优点。该方法首先在每个状态通过用矢量量化误差值取代传统HMM的输出概率值来建立VQ-HMM,同时采用无教师自适应矢量量化算法,来改变VQ-HMM的各状态的码字,从而实现对未知说话人的码本适应。本文通过非特定人汉语数码(孤立和连续数码)识别实验,把新的组合方法同基于CHMM的自适应和识别方法进行了比较,实验结果表明该方法鲁棒性好,所需计算量较少,自适应和识别效果远优于基于CHMM的方法。  相似文献   

17.
人脸在视频节目中代表了重要语义信息 ,提出使用支持向量机和隐马尔可夫链混合模型对人脸进行识别 ,然后把识别结果进行高斯聚类 ,实现视频节目的内容标注 .具体步骤如下 :首先建立人脸肤色模型 ,对视频图像中可能的人脸区域进行定位 ;从定位区域提取人脸各个器官的独立基特征 ,然后使用支持向量机和隐马尔可夫链混合模型对定位区域进行人脸识别 ,最后由高斯聚类完成视频节目的语义标注  相似文献   

18.
基于BPNN/HMM神经网络的声学模型研究   总被引:1,自引:0,他引:1  
研制了一种基于BP神经网络和隐马尔可夫模型(HMM)的混合声学模型,BP神经网络的主要功能是把失真语音特征矢量转换成纯净语音特征矢量,而删则对转换后的纯净语音特征矢量进行分类,从模型级补偿的方面来提高语音识别系统的鲁棒性.讨论了一种基于线性预测的MKCC语音特征提取方法,该方法把提取出的失真语音特征矢量作为神经网络的输入,从而实现了特征参数级去噪处理的目的.  相似文献   

19.
基于话者分类和HMM的话者自适应语音识别   总被引:2,自引:1,他引:2  
本文提出了一种基于话者分类和HMM的话者自适应语音识别方法,采用对参考话者聚类、并按话者类分别建立HMM模板的策略,对于新注册的用户,系统只需利用其极少量的语音,便可将与之最相近的一类模板指派给新用户,再采用基于谱空间映射的两级自适应方法,使系统自适应到用户的模式下工作.这种方法既提高了识别性能,又降低了自适应的难度,还有利于HMM的建立.讨论了话者分类数和自适应语音数据对话者自适应效果及识别性能的影响,提出了一种在自适应语音数据不足情况下仍具有较好自适应效果的基于FVQ的码本自适应改进算法,该算法还具有对自适应字表不敏感的特点.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号