首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
为了给说话人识别系统的应用提供一个较为重要的技术途径,利用美国TI公司生产的TMS320VC5402DSP作为CPU开发的DSP(D igital S ignal Processor)系统,实时实现了一个基于说话人自适应的开集说话人识别系统。为了提高系统的处理速度和识别的准确性,系统采用少量的语音数据产生说话人模型,在改进的矢量量化方法的基础上,利用一种说话人自适应的阈值处理算法,有效地提高了系统的识别率。同时对降低算法的计算量、数据的存储量进行了较深入的研究。从说话人识别的响应时间、训练时间等综合方面考虑,使真正意义上的说话人识别系统在DSP芯片上实现成为可能。实验表明,该系统在普通机房条件下,可以取得较好的实验效果,系统识别时间小于1 s,完全满足实时性的要求。  相似文献   

2.
基于高斯混合模型的说话人识别系统   总被引:2,自引:0,他引:2  
针对概率得分均值法出现的单个帧概率打分容易畸低的情况以及投票法因归一化而损失掉正面影响帧的打分,提出了一种引入可信度的均值方法,实验证明:该方法兼顾二者的优势的同时,在一定程度上消除了各自产生的不利影响,提高了说话人识别的精度。  相似文献   

3.
基于VQ的说话人识别系统的实现   总被引:1,自引:0,他引:1  
王吉林 《高等职业教育》2004,13(6):39-42,48
系统以语音信号的LPC倒谱系数、差值倒谱系数、基音周期和差值基音周期的混合特征参数作为识别的特征矢量集,运用矢量量化(VQ)技术实现了与文本有关的说话人识别。在一个10人,1800个语音的语音库上进行了系统的识别实验,其中单音节语音的平均识别率达到了92%,双音节语音达到了96.67%,四音节语音达到了97.67%。系统用于实时识别也收到了较好的效果。  相似文献   

4.
本文根据网络服务的特点提出了一种分布式的说话人识别系统,从文本选择、模式匹配以及判决方式方面给出了具体方案.在模式匹配中对VQ算法进行了改进以提高系统的实时性及可用性.  相似文献   

5.
防止假冒者闯入说话人识别系统   总被引:3,自引:0,他引:3  
如何防止假冒者闯入,是说话人识别研究中的重要课题之一.回放高保真录音和模仿目标说话人声音是假冒者闯入说话人识别系统的2种常见方式.该文针对用高保真录音来闯入系统进行了初步探索.高保真录音设备是一个模数转换系统,语音通过它会发生一些特性变化.通过检测语音中是否存在高保真录音设备的特性,可以检测假冒者是否在使用回放高保真录音来闯入系统.以Gauss混合模型和通用背景模型(Gaussian mixture model-universal background model,GMM-UBM)说话人识别系统为基础,用语音数据的静音段对信道进行建模,检测待识别语音与训练语音的信道是否相同,进而判断是否属于高保真录音闯入.实验表明,加入了基于静音段的信道检测后,说话人识别系统对含有假冒者闯入的测试数据的等错误率下降了40%左右.  相似文献   

6.
研究的说话人识别系统,采用能够反映人对语音的感知特性的线性预测(LPC)倒谱参数作为特征参数,同时对特征参数各维分量的识别能力进行定量分析,采用一种新的加权方法进行矢量量化,在此方法下系统取得识别率很高的效果,而且计算量和存储量都比较低.  相似文献   

7.
刘祥楼 《科学技术与工程》2012,12(11):2590-2593
摘要:说话人识别混合方法是目前研究的热点,基于虚拟仪器技术并融合说话人识别技术,提出矢量量化和支持向量机方法结合,依托MATLAB实现运算,由LabVIEW以多任务管理和调用MATLAB来实现说话人并行识别处理。经自建小样本语料库仿真实验,结果表明:系统识别率98.54%、误识率5.28%、识别时间0.25秒,较单一矢量量化和支持向量机方法识别率分别提高了3.66%和1.16%,误识率分别降低了6.01%和4.43%;随着样本数的增多,矢量量化方法识别率呈上升趋势,而支持向量机方法识别率呈下降趋势。由此可见:两种方法优势互补实现并行识别可提高系统主体性能。  相似文献   

8.
对法庭分析系统进行验证测试是保证其司法应用的前提和基础。国际上,不同法庭科学实验室在法庭说话人识别实践中采用的方法、系统和评价体系并不一致。然而,无论采用何种方法或系统,都应该基于被检案件的实际条件进行测试、验证和评价。首先,从国际上对于科学证据的要求出发,阐明进行法庭说话人识别系统验证的重要性和必要性;其次,介绍验证的基本原则和程序方法;最后,通过一项多系统验证评价的范例,表明司法实践中如何进行法庭说话人识别系统的验证评测,并对其中的重要问题加以总结说明。  相似文献   

9.
白玉  陈立伟 《应用科技》2005,32(12):45-47,50
提出一种基于遗传神经网络的说话人识别系统.将遗传算法和矢量量化技术结合建立说话人模型,然后利用遗传神经网络进行识别.实验结果表明,这种方法既降低了用户的语音数据采集量,有利于话者模板的建立,又提高了系统的识别性能及鲁棒性,较传统方法有明显的优越性.  相似文献   

10.
以Samsung系列S3C4510B开发板为硬件平台,通过研究uCiinux源代码体系结构,分析了uCiinux网络部分启动全过程,并对该系统中的TCP/IP协议栈做模块化改造,提高了嵌入式网络开发速度。  相似文献   

11.
声学特征提取是语音信号处理,如语音识别、语音唤醒、说话人识别等的核心技术之一.围绕说话人识别任务详细介绍了其主流声学特征,以及采用这些声学特征后所产生的问题和改进方法.同时,基于说话人区分向量(x-vector)说话人识别架构提出了一种双声学特征整合的方法,以改善识别性能,并在公开的VoxCeleb1数据集上对比几种常用声学特征在x-vector框架下的说话人识别结果,进一步验证了所提出的双特征整合方法的有效性.  相似文献   

12.
蔡铁  朱杰 《上海交通大学学报》2005,39(12):1997-2001
针对语音识别系统中快速说话人自适应问题,提出了一种支持说话人权重算法.该算法通过支持说话人的计算实现了说话人选择与自适应参数的降维,减少了自适应时的存储量,有效提高了自适应数据较少时的性能.有监督自适应的实验结果表明,在仅有一句自适应语句的情况下系统误识率相对非特定人(SI)系统下降了5.82%,明显优于其他快速自适应算法.  相似文献   

13.
实现了一个基于双分界面的支持向量机的文本无关说话人识别系统,该系统在建立模型的过程中使用高斯混合模型进行特征提取,有效地减少了数据集的规模。与传统的支持向量机方法相比,该方法不仅达到了更高的识别率,对环境具有良好的鲁棒性,并且降低了算法的时间复杂度。由于该方法对大规模数据集的处理能力,使其比传统的方法更适合应用于实际。在相关实验中,也证实了该方法的有效性。  相似文献   

14.
介绍了通过GPRS无线网络在51单片机上实现TCP/IP协议进行点对点可靠的大数据量传输的方法。在设计中使用P89C51RD芯片和WAVECOMQ2403AGPRS模块,外扩32KB的RAM用于对TCP/IP数据包的缓存和1Mb的Flash用于对大数据的存储。  相似文献   

15.
基于听觉生理和心理学的感知机理,提出一种适于说话人识别的特征参数提取方法。该方法采用Gammatone滤波器组代替常用的三角形滤波器组计算出语音信号各子带能量,根据等效矩形带宽模型,确定了各个滤波器的中心频率与带宽。同时从语音信号各子频带携带的说话人个性特征信息量角度分析对滤波器子带进行加权处理,最后结合倒谱均值减方法对特征进行处理,最终生成具有较高鲁棒性的特征。采用高斯混合模型对说话人进行建模,仿真实验的结果表明:提出的特征参数对含噪语音的与文本无关说话人识别具有较好的效果,在低信噪比情况下,具有比传统特征参数更好的噪声鲁棒性。  相似文献   

16.
说话人识别技术是根据待识别人的语音与预先提取的说话人语音特征是否相匹配来鉴别说话人身份的一种生物认证技术,具有广泛的应用前景。采用矢量量化(VQ)方法,可以在信息量损失较小的情况下更好地压缩数据量,从而增高说话人识别系统的识别率。本文研究了说话人识别的相关技术,提出并设计了一个基于VQ的说话人识别系统,当用于训练的数据量较小时,可以得到比较稳定的识别性能。  相似文献   

17.
说话人识别技术作为一种身份识别的手段,具有独特的优势,是语音信号处理中的重要组成部分,近年来也逐渐成为国际上研究的热点.本文综述了说话人识别技术的发展及其相关技术,对现有的各种方法的优点和不足进行了分析,并对其中存在的问题和未来的研究方向进行了探讨.  相似文献   

18.
为了克服传统VQ与GMM说话人识别的缺点,提出了一种新的FVQMM说话人识别方法。该方法综合了VQ、GMM和模糊集理论的优点。通过用模糊VQ误差尺度取代传统GMM的输出概率函数,减少了建模时对训练数据量的要求,提高了识别速度。实验结果表明该方法是有效的。  相似文献   

19.
在虚拟仪器平台上,通过微型麦克与计算机声卡对语音信号进行实时采集,并进行消噪处理和端点检测,以美尔频率倒谱系数及其差分作为特征参数提取方法,应用改进的矢量量化一隐马尔可夫识别算法,设计了与文本无关的说话人识别系统。系统运行结果表明,本文实现的系统运算速度快,且具有较高的识别率。  相似文献   

20.
基于大学生的汉语说话人识别语音库设计   总被引:3,自引:0,他引:3  
本文设计了一个基于在校大学生的说话人识别语音库UMSD,其目的主要是用于研究说活人个体特征变迁、文本有关和文本无关的说活人识别。该语音库包含24名说话人的12期录音,相邻录音间隔从1天到60天不等,在同一间安静的办公室环境下录制完成。录制语料包括:孤立数码,数码串,长度从1到10的词句,汉语拼音表,古诗词和短文。为了便于提取感兴趣的音段,本文还基于Matlab和Ms—Access设计了相应的语音库管理系统。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号