首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
基于VQ的说话人识别系统的实现   总被引:1,自引:0,他引:1  
王吉林 《高等职业教育》2004,13(6):39-42,48
系统以语音信号的LPC倒谱系数、差值倒谱系数、基音周期和差值基音周期的混合特征参数作为识别的特征矢量集,运用矢量量化(VQ)技术实现了与文本有关的说话人识别。在一个10人,1800个语音的语音库上进行了系统的识别实验,其中单音节语音的平均识别率达到了92%,双音节语音达到了96.67%,四音节语音达到了97.67%。系统用于实时识别也收到了较好的效果。  相似文献   

2.
一种改进的新型说话人确认算法   总被引:1,自引:0,他引:1  
在单芯片上实现的说话人确认系统是说话人识别应用的重要方向。该文面向片上应用,在使用DTW(dynamictime-warping)匹配方法的确认系统基础上提出一种改进的说话人确认算法,结合说话人确认的任务特点对DTW算法进行了改进:1)引入分层判决思想,2)在判决中结合单帧说话人区分能力估计,使系统的识别性能得到改进。新系统能够在对模板应用压缩处理后仍然保持良好的识别性能。测试表明新确认系统不做模板压缩时的等错误率为1.81%,经过1:8模板压缩处理后新系统的等错误率为2.35%。  相似文献   

3.
为了给说话人识别系统的应用提供一个较为重要的技术途径,利用美国TI公司生产的TMS320VC5402DSP作为CPU开发的DSP(D igital S ignal Processor)系统,实时实现了一个基于说话人自适应的开集说话人识别系统。为了提高系统的处理速度和识别的准确性,系统采用少量的语音数据产生说话人模型,在改进的矢量量化方法的基础上,利用一种说话人自适应的阈值处理算法,有效地提高了系统的识别率。同时对降低算法的计算量、数据的存储量进行了较深入的研究。从说话人识别的响应时间、训练时间等综合方面考虑,使真正意义上的说话人识别系统在DSP芯片上实现成为可能。实验表明,该系统在普通机房条件下,可以取得较好的实验效果,系统识别时间小于1 s,完全满足实时性的要求。  相似文献   

4.
设计了一个基于LabVIEW的说话人确认系统。以计算机作为硬件平台,以LabVIEW作为软件平台,通过计算机上的声卡采集语音信号,借助LabVIEW和MATLAB的混合编程对语音信号进行处理,以实现对说话人身份的确认。该系统界面友好,维护费用低,为说话人识别和语音识别系统的构建提供了一个有效的框架。  相似文献   

5.
说话人识别中语音特征参数研究   总被引:1,自引:0,他引:1  
在说话人识别系统中,特征参数的选择和提取对系统的识别性能有关键性的影响。研究了两种重要的语音特征参数,线性预测倒谱系数和美尔倒谱系数,在此基础上提出改进的相位自相关系数,通过实验对几种参数进行了对比,结果表明改进的相位自相关系数能够使系统的误识率明显下降。  相似文献   

6.
比较了基于因特网的说话人识别技术中Mel倒谱特征各阶参数的抗噪性能,并分析和验证了交织及丢失数据替代技术对改善基于因特网的说话人识别系统性能的重要作用。  相似文献   

7.
基于HMM/MLFNN混合结构的说话人辨认研究   总被引:3,自引:0,他引:3  
将隐马尔可夫模型与人工神经网络相结合既利用HMM能够较好地描述动态时间序列又ANN静态分类能力强的特点,应用于说话人辨认。本文将一个多层前馈神经网络与HMM相结合构成混合模模型,与以往的方法不同。具有所需训练数据量小,推广性能良好的特点。  相似文献   

8.
该文针对LBG算法可能有空胞腔产生及有些码字利用率低的问题,提出了一种改进的矢量量化算法,并将其应用到与文本无关的说话人识别研究,得到了一种新的说话人识别方法.实验表明,这种方法对说话人的识别性能好于基于LBG算法的说话人识别方法.  相似文献   

9.
针对Mel频率倒谱系数(Mel frequency cepstralcoefficient,MFCC)特征的说话人确认系统在干净语音环境下具有很高识别率但在噪音环境下识别率急剧下降的缺点,构建了基于感知对数面积比系数(perceptual log area ratio,PLAR)特征的说话人确认系统,并对该系统的噪音鲁棒性进行研究。结果表明:PLAR特征具有较强的噪音鲁棒性。将PLAR与MFCC进行特征域和分数域的融合,利用两者之间存在着的互补性,可有效提高说话人确认系统的识别性能。  相似文献   

10.
提出了一种新的语音识别方法,该方法综合了VQ,HMM和无教师说话人自适应算法的优点。该方法首先在每个状态通过用矢量量化误差值取代传统HMM的输出概率值来建立VQ-HMM,同时采用无教师自适应矢量量化算法,来改变VQ-HMM的各状态的码字,从而实现对未知说话人的码本适应。本文通过非特定人汉语数码(孤立和连续数码)识别实验,把新的组合方法同基于CHMM的自适应和识别方法进行了比较,实验结果表明该方法鲁棒性好,所需计算量较少,自适应和识别效果远优于基于CHMM的方法。  相似文献   

11.
基于话者分类和HMM的话者自适应语音识别   总被引:2,自引:1,他引:2  
本文提出了一种基于话者分类和HMM的话者自适应语音识别方法,采用对参考话者聚类、并按话者类分别建立HMM模板的策略,对于新注册的用户,系统只需利用其极少量的语音,便可将与之最相近的一类模板指派给新用户,再采用基于谱空间映射的两级自适应方法,使系统自适应到用户的模式下工作.这种方法既提高了识别性能,又降低了自适应的难度,还有利于HMM的建立.讨论了话者分类数和自适应语音数据对话者自适应效果及识别性能的影响,提出了一种在自适应语音数据不足情况下仍具有较好自适应效果的基于FVQ的码本自适应改进算法,该算法还具有对自适应字表不敏感的特点.  相似文献   

12.
一种基于隐马尔可夫模型的在线手写签名认证算法   总被引:1,自引:0,他引:1  
给出一种对签名特殊点的提取方法, 并以此特殊点作为签名的分割点, 获取每段中的重要特征进行分析. 在此基础上, 提出一种基于隐马尔可夫模型(HMM)的在线手写签名认证算法, 并利用第一届国际手写签名认证竞赛(SVC 2004)的测试数据库检验了算法的有效性.  相似文献   

13.
基于离散HMM的非特定人关键词提取语音识别系统   总被引:2,自引:0,他引:2  
设计了一个基于离散隐含马尔可夫整词模型的非特定人汉语小词表关键词提取语音识 别系统, 提出一种基于对前向、 后向搜索得到的关键词假设做二次识别的置信度策略. 将 该置信度用于关键词提取系统的说话验证, 得到了良好效果.  相似文献   

14.
为了建立一个数字串说话人身份确认系统 ,采用了基于数字HMM的与文本有关的身份确认方式 ;使用限定在数字范围内的任意数字串为语音文本 ,并内嵌能较好反映说话人特征的关键数字来提高确认性能 ;最终对多个关键数字的确认子系统进行综合判决 ,以提高HMM识别性能鲁棒性 .文中重点研究了基于关键数字HMM的身份确认 ,提出了以模型间的距离测度为准则来选择说话人的关键数字 ,并通过对比实验表明了用计算KLD上限的方法进行模型间距离测度的有效性 .  相似文献   

15.
针对传统的 HMM 模型中状态持续时间不长的不足,且在计算量大的情况下,语音识别精度不高,训练时间长,训练误差较高,提出了一种基于语音状态持续时间长的 HMM 模型。 首先,令状态转移矩阵的对角线元素全为 0,去掉自转移弧,再增添以参数化的函数描述持续时间的高斯分布,再通过帧与帧相互 之间的关联程度,将每帧都计算进去;其次,通过重估公式反复计算每条弧被指定的转变概率和可见符号序列输出最原始的数值概率,直至收敛,停止运算。 最后,在 HMM 模型改进前后实验中得到更小的训练误差,下降速度更快,计算量较之前减少多,更容易达到收敛,其概率输出与它前面一个概率输出的差值与该概率 输出值的比值大于 HMM 模型设定的初始值。 与传统 HMM 模型实验比较,基于持续时间状态的 HMM 模型可以在一定程度上降低训练次数和训练时间,提高识别语音的精确度,基本完成了语音识别系统的功能。  相似文献   

16.
针对非线性动态系统估计问题,引入了一种不完全观测数据的统计模型--HMM模型,其双层随机结构较好地满足了实际估计的要求.在具体滤波过程中,将处理非线性问题常用的贝叶斯方法和HMM模型进行结合,通过预测和更新操作实现系统状态后验的连续递推估计,提高了运算速度.  相似文献   

17.
基于HMM与神经网络的声学模型研究   总被引:6,自引:0,他引:6  
神经网络能依靠权值进行长时间记忆和知识存储,但是对输入模式的瞬时相应的记忆能力比较差;而隐马尔科夫模型的短时记忆的能力比较强,但是假定的前提又与实际情况不符.因此,采用HMM和ANN的混合模型来取双方之长,并在这种混合模型的基础上,对神经网络从结构设计、训练、到训练后期的结构调整进行了全程的优化;应用隐节点剪枝算法,并利用广义的Hebb规则重新确定网络的参数.实验表明,这种混合模型在语音识别中取得了良好的效果.  相似文献   

18.
说话人辨认是语音信号研究中的一个重要组成部分。本文根据掌上电脑录音的语音数据库进行说话人辨认的实验。当高斯混合模型(GMM)用于说话人辨认,而特征矢量的协方差矩阵取不同形式时,比较用EM算法对模型参数进行估计的收敛性以及对说话人辨认的影响。实验表明,当特征矢量参数协方差矩阵为满矩阵时,EM算法能更有效估计GMM参数,有效提高识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号