首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
基于高斯混合模型的说话人识别系统   总被引:2,自引:0,他引:2  
针对概率得分均值法出现的单个帧概率打分容易畸低的情况以及投票法因归一化而损失掉正面影响帧的打分,提出了一种引入可信度的均值方法,实验证明:该方法兼顾二者的优势的同时,在一定程度上消除了各自产生的不利影响,提高了说话人识别的精度。  相似文献   

2.
防止假冒者闯入说话人识别系统   总被引:3,自引:0,他引:3  
如何防止假冒者闯入,是说话人识别研究中的重要课题之一.回放高保真录音和模仿目标说话人声音是假冒者闯入说话人识别系统的2种常见方式.该文针对用高保真录音来闯入系统进行了初步探索.高保真录音设备是一个模数转换系统,语音通过它会发生一些特性变化.通过检测语音中是否存在高保真录音设备的特性,可以检测假冒者是否在使用回放高保真录音来闯入系统.以Gauss混合模型和通用背景模型(Gaussian mixture model-universal background model,GMM-UBM)说话人识别系统为基础,用语音数据的静音段对信道进行建模,检测待识别语音与训练语音的信道是否相同,进而判断是否属于高保真录音闯入.实验表明,加入了基于静音段的信道检测后,说话人识别系统对含有假冒者闯入的测试数据的等错误率下降了40%左右.  相似文献   

3.
提出了一种新的语音识别方法,该方法综合了VQ,HMM和无教师说话人自适应算法的优点。该方法首先在每个状态通过用矢量量化误差值取代传统HMM的输出概率值来建立VQ-HMM,同时采用无教师自适应矢量量化算法,来改变VQ-HMM的各状态的码字,从而实现对未知说话人的码本适应。本文通过非特定人汉语数码(孤立和连续数码)识别实验,把新的组合方法同基于CHMM的自适应和识别方法进行了比较,实验结果表明该方法鲁棒性好,所需计算量较少,自适应和识别效果远优于基于CHMM的方法。  相似文献   

4.
研究的说话人识别系统,采用能够反映人对语音的感知特性的线性预测(LPC)倒谱参数作为特征参数,同时对特征参数各维分量的识别能力进行定量分析,采用一种新的加权方法进行矢量量化,在此方法下系统取得识别率很高的效果,而且计算量和存储量都比较低.  相似文献   

5.
近年来随着网络和语音处理技术的快速发展,分布式语音识别(DSR)成为语音处理的一个研究方向,与传统集中式语音识别不同的是:它基于Client/Server模型,在Client端进行参数的提取,然后通过信道传送到Server端进行识别,把结果送回到Client端。文中介绍基于LAN所设计的DSR系统。  相似文献   

6.
声学特征提取是语音信号处理,如语音识别、语音唤醒、说话人识别等的核心技术之一.围绕说话人识别任务详细介绍了其主流声学特征,以及采用这些声学特征后所产生的问题和改进方法.同时,基于说话人区分向量(x-vector)说话人识别架构提出了一种双声学特征整合的方法,以改善识别性能,并在公开的VoxCeleb1数据集上对比几种常用声学特征在x-vector框架下的说话人识别结果,进一步验证了所提出的双特征整合方法的有效性.  相似文献   

7.
阐述了分析非线性、非平稳信号的Hilbert—Huang变换(HHT)算法。针对非平稳语音信号,提出了一种基于HHT的提取语音特征参数HHT—IF的新方法,设计了基于VQ的说话人辨认系统,分别采用HHT-IF和LPCC从不同角度进行说话人辨认实验。结果表明,特征参数HHT-IF用于说话人识别是可行的。  相似文献   

8.
高原 《科技信息》2011,(23):I0029-I0029,I0042
在Visual C++软件环境下设计出了适合于网络环境的说话人识别系统客户端。详细阐述了语音库选择、语音信号预处理、特征参数提取以及基于TCP协议的数据发送模块,较好地满足了客户端内存容量有限以及网络传输的要求。  相似文献   

9.
为了给说话人识别系统的应用提供一个较为重要的技术途径,利用美国TI公司生产的TMS320VC5402DSP作为CPU开发的DSP(D igital S ignal Processor)系统,实时实现了一个基于说话人自适应的开集说话人识别系统。为了提高系统的处理速度和识别的准确性,系统采用少量的语音数据产生说话人模型,在改进的矢量量化方法的基础上,利用一种说话人自适应的阈值处理算法,有效地提高了系统的识别率。同时对降低算法的计算量、数据的存储量进行了较深入的研究。从说话人识别的响应时间、训练时间等综合方面考虑,使真正意义上的说话人识别系统在DSP芯片上实现成为可能。实验表明,该系统在普通机房条件下,可以取得较好的实验效果,系统识别时间小于1 s,完全满足实时性的要求。  相似文献   

10.
单进 《科技资讯》2010,(21):3-3
近年来,随着科学技术日新月异的发展,特别在生物识别技术领域中,说话人识别技术更是以其独特的优势受到世人瞩目,在生活中得到了广泛的应用。本文介绍了说话人识别的概念、原理及其识别方法,指出了说话人识别技术的应用前景。  相似文献   

11.
刘祥楼 《科学技术与工程》2012,12(11):2590-2593
摘要:说话人识别混合方法是目前研究的热点,基于虚拟仪器技术并融合说话人识别技术,提出矢量量化和支持向量机方法结合,依托MATLAB实现运算,由LabVIEW以多任务管理和调用MATLAB来实现说话人并行识别处理。经自建小样本语料库仿真实验,结果表明:系统识别率98.54%、误识率5.28%、识别时间0.25秒,较单一矢量量化和支持向量机方法识别率分别提高了3.66%和1.16%,误识率分别降低了6.01%和4.43%;随着样本数的增多,矢量量化方法识别率呈上升趋势,而支持向量机方法识别率呈下降趋势。由此可见:两种方法优势互补实现并行识别可提高系统主体性能。  相似文献   

12.
说话人识别技术是根据待识别人的语音与预先提取的说话人语音特征是否相匹配来鉴别说话人身份的一种生物认证技术,具有广泛的应用前景。采用矢量量化(VQ)方法,可以在信息量损失较小的情况下更好地压缩数据量,从而增高说话人识别系统的识别率。本文研究了说话人识别的相关技术,提出并设计了一个基于VQ的说话人识别系统,当用于训练的数据量较小时,可以得到比较稳定的识别性能。  相似文献   

13.
基于VQ的说话人识别系统的实现   总被引:1,自引:0,他引:1  
王吉林 《高等职业教育》2004,13(6):39-42,48
系统以语音信号的LPC倒谱系数、差值倒谱系数、基音周期和差值基音周期的混合特征参数作为识别的特征矢量集,运用矢量量化(VQ)技术实现了与文本有关的说话人识别。在一个10人,1800个语音的语音库上进行了系统的识别实验,其中单音节语音的平均识别率达到了92%,双音节语音达到了96.67%,四音节语音达到了97.67%。系统用于实时识别也收到了较好的效果。  相似文献   

14.
对法庭分析系统进行验证测试是保证其司法应用的前提和基础。国际上,不同法庭科学实验室在法庭说话人识别实践中采用的方法、系统和评价体系并不一致。然而,无论采用何种方法或系统,都应该基于被检案件的实际条件进行测试、验证和评价。首先,从国际上对于科学证据的要求出发,阐明进行法庭说话人识别系统验证的重要性和必要性;其次,介绍验证的基本原则和程序方法;最后,通过一项多系统验证评价的范例,表明司法实践中如何进行法庭说话人识别系统的验证评测,并对其中的重要问题加以总结说明。  相似文献   

15.
白玉  陈立伟 《应用科技》2005,32(12):45-47,50
提出一种基于遗传神经网络的说话人识别系统.将遗传算法和矢量量化技术结合建立说话人模型,然后利用遗传神经网络进行识别.实验结果表明,这种方法既降低了用户的语音数据采集量,有利于话者模板的建立,又提高了系统的识别性能及鲁棒性,较传统方法有明显的优越性.  相似文献   

16.
说话人识别技术作为一种身份识别的手段,具有独特的优势,是语音信号处理中的重要组成部分,近年来也逐渐成为国际上研究的热点.本文综述了说话人识别技术的发展及其相关技术,对现有的各种方法的优点和不足进行了分析,并对其中存在的问题和未来的研究方向进行了探讨.  相似文献   

17.
主要对文本无关的说话人识别技术进行一些探讨。与语音识别不同,说话人识别技术必须提取说话人依赖特点,而语音特征量的选取是利用说话人声音的频谱通过分离傅立叶变换(DCT)获得的。在训练阶段,每一个说话者通过矢量量化产生一个码书(语音数据库)。在认识阶段期间,通过对欧几里德距离代表VQ的计算来减少失真。在一定范围的说话人的语音库中,测试结果表明有很高的识别率,可以达到96%。  相似文献   

18.
蔡铁  朱杰 《上海交通大学学报》2005,39(12):1997-2001
针对语音识别系统中快速说话人自适应问题,提出了一种支持说话人权重算法.该算法通过支持说话人的计算实现了说话人选择与自适应参数的降维,减少了自适应时的存储量,有效提高了自适应数据较少时的性能.有监督自适应的实验结果表明,在仅有一句自适应语句的情况下系统误识率相对非特定人(SI)系统下降了5.82%,明显优于其他快速自适应算法.  相似文献   

19.
设计一种以TM S320VC5402为核心,外围扩展语音编解码器、程序存储器、语音存储器等集成电路,基于定点数字信号处理器的实时说话人身份识别的系统.通过为每个语音命令设置3个模板的预留空间,使每个语音命令可以有3个模板参与识别,避免说话人语气和语调的变化产生的影响.在比较嘈杂的环境下,系统的正确识别率超过87%.处理器VC5402从识别中断并响应中断到CPU进入中断服务程序的第1条指令,需要20个时钟周期,系统的平均处理时间小于0.2 s.  相似文献   

20.
将神经网络预测模型(NPM)应用于说话人识别中,经过实验,获得了较满意的结果。这说明神经网络对于说话人识别是一种很有潜力的方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号