首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
为了提高基于Gauss混合模型通用背景模型(GMM-UBM)的说话人辨认系统的运算效率,提出一种基于参考说话人模型的双层结构用于目标说话人剪枝,采用矢量量化方法从目标说话人模型集合中训练参考说话人模型,利用语音与参考说人模型的偏差来描述说话人的发音特性,将辨认语音偏差向量和目标说话人偏差向量的相似性作为距离度量来进行目标说话人剪枝。实验结果表明:在基于GMM-UBM的说话人辨认系统中,对包含5 200个目标说话人和1 000个集外说话人的测试集进行开集辨认的条件下,在提高辨认的运算效率12.5倍的同时识别率仅下降0.3%。  相似文献   

2.
一种改进的新型说话人确认算法   总被引:1,自引:0,他引:1  
在单芯片上实现的说话人确认系统是说话人识别应用的重要方向。该文面向片上应用,在使用DTW(dynamictime-warping)匹配方法的确认系统基础上提出一种改进的说话人确认算法,结合说话人确认的任务特点对DTW算法进行了改进:1)引入分层判决思想,2)在判决中结合单帧说话人区分能力估计,使系统的识别性能得到改进。新系统能够在对模板应用压缩处理后仍然保持良好的识别性能。测试表明新确认系统不做模板压缩时的等错误率为1.81%,经过1:8模板压缩处理后新系统的等错误率为2.35%。  相似文献   

3.
两级决策的开集说话人辨认方法   总被引:10,自引:0,他引:10  
为了减少语音数据量 ,提高处理速度和识别的准确性 ,提出了一种采用公共码本、个人隐 Markov模型 (HMM)和个人拒识阈值进行两级决策来实现开集说话人辨认的新方法。在系统实现时 ,采用了一种改进的语音切分算法来提高输入数据的有效性 ,并将说话人识别和人脸识别融合在一起进行身份验证。实验证明这种融合方法能够有效地降低识别的相等错误率至 1%。  相似文献   

4.
说话人识别技术作为一种身份识别的手段,具有独特的优势,是语音信号处理中的重要组成部分,近年来也逐渐成为国际上研究的热点.本文综述了说话人识别技术的发展及其相关技术,对现有的各种方法的优点和不足进行了分析,并对其中存在的问题和未来的研究方向进行了探讨.  相似文献   

5.
蔡铁  朱杰 《上海交通大学学报》2005,39(12):1997-2001
针对语音识别系统中快速说话人自适应问题,提出了一种支持说话人权重算法.该算法通过支持说话人的计算实现了说话人选择与自适应参数的降维,减少了自适应时的存储量,有效提高了自适应数据较少时的性能.有监督自适应的实验结果表明,在仅有一句自适应语句的情况下系统误识率相对非特定人(SI)系统下降了5.82%,明显优于其他快速自适应算法.  相似文献   

6.
采用线性预测倒谱系数(linear prediction cepstrum coefficient, LPCC)作为语音的特征参数,矢量量化(vector quantity,VQ)方法进行模式匹配,探讨声纹识别以实现身份认证,并对此识别方法进行了相关的实验.通过验证,这种方法可以区分不同的说话人,并且在做说话人辨认实验时可达到较高的识别率.  相似文献   

7.
在说话人识别系统中,训练语音与测试语音的话机类型失配会使说话人识别系统识别性能显著下降。为了提高说话人识别系统的稳健性,在说话人模型合成和话机归一化的基础上提出一种新的信道补偿方法HNSSM(handsetnormalizationinsynthesizedspeakmodel),综合模型和分数两个方面对系统进行信道补偿。1999年美国国家标准技术局说话人识别评测语音库上的实验表明,采用新的信道补偿方法使系统在等错误率和最小检测代价上比仅采用倒谱均值减的基线系统分别降低了39.4%和20.9%,而且优于只采用说话人模型合成或话机归一化补偿的系统。  相似文献   

8.
为了解决浅层特征不能有效刻画说话人特征,导致说话人检索率不高的问题,提出了一种基于深层说话人矢量的说话人检索方法.使用受限波尔兹曼机逐层构建一个多层的深层特征提取器用以提取说话人深层特征.为说话人构建基于深层特征的深层说话人矢量.通过计算要检索的说话人的深层说话人矢量和检索库中的说话人深层特征之间的最小距离,对目标说话人进行检索.实验结果表明:在深层特征下,使用深层说话人矢量可以检索到绝大部分的目标说话人;随着深度层数的增加,检索率先增后减,检索率最高对应的深度层数是7;随着深度层数的增加,检索时间非线性增加.  相似文献   

9.
单进 《科技资讯》2010,(21):3-3
近年来,随着科学技术日新月异的发展,特别在生物识别技术领域中,说话人识别技术更是以其独特的优势受到世人瞩目,在生活中得到了广泛的应用。本文介绍了说话人识别的概念、原理及其识别方法,指出了说话人识别技术的应用前景。  相似文献   

10.
基于大学生的汉语说话人识别语音库设计   总被引:3,自引:0,他引:3  
本文设计了一个基于在校大学生的说话人识别语音库UMSD,其目的主要是用于研究说活人个体特征变迁、文本有关和文本无关的说活人识别。该语音库包含24名说话人的12期录音,相邻录音间隔从1天到60天不等,在同一间安静的办公室环境下录制完成。录制语料包括:孤立数码,数码串,长度从1到10的词句,汉语拼音表,古诗词和短文。为了便于提取感兴趣的音段,本文还基于Matlab和Ms—Access设计了相应的语音库管理系统。  相似文献   

11.
基于组合神经网络的与文本无关的说话人识别   总被引:1,自引:1,他引:0  
提出了一种用于N个说话人识别的组合神经网络,由N个子网组成,每个子网完成两类模式区分,将这N个子网组合起来完成N类模式的区分.子网选用RBF神经网络,并给出了自组织选取中心的方法.实验显示,对6名说话人,识别率达到94%.对10名说话人,识别率达93.17%.  相似文献   

12.
设计了一个基于LabVIEW的说话人确认系统。以计算机作为硬件平台,以LabVIEW作为软件平台,通过计算机上的声卡采集语音信号,借助LabVIEW和MATLAB的混合编程对语音信号进行处理,以实现对说话人身份的确认。该系统界面友好,维护费用低,为说话人识别和语音识别系统的构建提供了一个有效的框架。  相似文献   

13.
目的 获得具有更好的说话人鉴别特征,改善说话人识别系统.方法 首先用KFD对语音信号的MFCC特征进行再提取,然后用SVM对提取的特征分类辨认.结果 比较了LPC和KDA提取MFCC后的3种特征的识别结果.其中LPC的识别结果在89%左右,MFCC识别结果在96%左右,提取后的识别结果在97%左右.其识别率比提取前有明显的提高.结论 该方法对说话人有更好的识别能力.KFD比传统的LDA能提取出可分性更强的特征,提高了系统的识别率,同时由于该方法的复杂性,也增加了系统的运算时间.今后,应该针对如何进一步提高系统的识别率和缩短系统的运算时间等问题进行研究.  相似文献   

14.
为了给说话人识别系统的应用提供一个较为重要的技术途径,利用美国TI公司生产的TMS320VC5402DSP作为CPU开发的DSP(D igital S ignal Processor)系统,实时实现了一个基于说话人自适应的开集说话人识别系统。为了提高系统的处理速度和识别的准确性,系统采用少量的语音数据产生说话人模型,在改进的矢量量化方法的基础上,利用一种说话人自适应的阈值处理算法,有效地提高了系统的识别率。同时对降低算法的计算量、数据的存储量进行了较深入的研究。从说话人识别的响应时间、训练时间等综合方面考虑,使真正意义上的说话人识别系统在DSP芯片上实现成为可能。实验表明,该系统在普通机房条件下,可以取得较好的实验效果,系统识别时间小于1 s,完全满足实时性的要求。  相似文献   

15.
基于高斯混合模型的说话人识别系统   总被引:2,自引:0,他引:2  
针对概率得分均值法出现的单个帧概率打分容易畸低的情况以及投票法因归一化而损失掉正面影响帧的打分,提出了一种引入可信度的均值方法,实验证明:该方法兼顾二者的优势的同时,在一定程度上消除了各自产生的不利影响,提高了说话人识别的精度。  相似文献   

16.
针对最大似然训练分辨能力的不足,把最大互信息训练方法引入到高斯混合模型(GMM)的训练中,并直接采用进化策略实现模型参数的全局训练,以模型与训练数据之间的互信息作为进化过程中个体的适应度。该系统不仅分辨能力强,而且摆脱了局部搜索的缺陷。实验结果表明,这种方法生成的说话人辨认系统的识别性能要优于传统的期望最大化算法(EM)生成的系统。  相似文献   

17.
将神经网络预测模型(NPM)应用于说话人识别中,经过实验,获得了较满意的结果。这说明神经网络对于说话人识别是一种很有潜力的方法。  相似文献   

18.
本文根据网络服务的特点提出了一种分布式的说话人识别系统,从文本选择、模式匹配以及判决方式方面给出了具体方案.在模式匹配中对VQ算法进行了改进以提高系统的实时性及可用性.  相似文献   

19.
目的为保证网络信息交互的安全,在数字语音通信中对说话人进行身份认证。方法利用回声隐藏技术,在语音信号中嵌入表征说话人身份的数字签名。结果实验证明,引入的回声信号听觉上不能感知。通过倒谱分析,能够完整地从隐写语音信号中提取出数字签名。结论是一种有效的说话人认证方法,具有广泛的应用前景。  相似文献   

20.
在大多数的说话人识别系统中,需要首先建立一个说话人无关的模型,这种模型成为全局模型.然后在实际应用中,采取某种自适应的算法来修改此模型.采取这种说话人无关模型的一个不利之处在于性能会随着应用环境和训练环境差异的增大而大幅度降低.为了修补这种差异,就需要较长的训练时间,使得这种方法不利于比较实时的应用,比如通过电话进行远程说话人识别,在这种情况中需要较快的响应速度.本文中提出了一个利用全局模型并能适用于远程说话人识别的方法.基本思路就是在进行识别时利用以前的模型,然后再系统空闲时采取了一个改进的自适应算法快速重建全局模型.试验结果证明了这种方法是可行的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号