共查询到19条相似文献,搜索用时 78 毫秒
1.
为了解决动态环境下的说话人识别的辨认率问题,在识别阶段,把小生境粒子群算法应用于GMM之中。从实验得出,采用基于小生境粒子群的高斯混合模型提高了识别性能。 相似文献
2.
基于语音识别的说话人身份辨识系统 总被引:2,自引:0,他引:2
提出一种在小字库孤立语音条件下,集成语音识别与说话人的识别技术,并进行说话人身份代码(密码)识别、认证.利用语音信号的短时分析技术进行孤立词的单元分割,采用临界带特征矢量作为语音信号特征,分析了经典语音识别算法——动态时间规整算法,提出了对语音模板各帧加权的改进方法.为提高识别响应速度,研究了多门限多轮次的判决方法,在增加多套模板、提高识别率的情况下,降低了系统的响应时间. 相似文献
3.
在噪声环境下,稀疏表示方法并没有表现出它出色的区分性能,反而由于特征的分散导致性能的大幅下降。根据语音特征参数之间的相关性,提出了一种适用于稀疏表示说话人识别的全局补偿方法。该方法对不同阶特征参数进行逐一分析,目的是为了找出被噪声影响最严重的一阶参数并去除之,以此增强测试语音与训练语音之间的相关性。理论分析和实验结果表明,该方法具有很好的抗噪性能,在信噪比为5d B时,带有白噪声的语句识别率达到了85.7%,而在高信噪比时,其识别率能够达到97.5%,几乎等同于干净语音的识别率。 相似文献
4.
说话人识别是语音识别的一种特殊方式,其目的不是识别语音内容,而是识别说话人是谁,即从语音信号中提取个人特征。采用动态时间规整(DTW)方法,可以利用使用过程中的数据不断修正原模板,使模板逐次趋于完善。本文研究了说话人识别的相关技术,提出并设计了一个基于DTW的说话人识别系统,当用于训练的数据量较小时,可以得到比较稳定的识别性能。 相似文献
5.
说话人识别技术是通过判断待识别人语音与预先提取的说话人语音特征是否匹配来鉴别说话人身份的一种生物认证技术,环境噪声是说话人识别技术走向实用化的一个主要障碍.针对噪声环境中说话人识别性能较差的不足,结合小波变换的优点,提出了将小波变换技术与传统的特征参数提取方式相结合的方法.该方法首先对语音信号进行小波分解,在此基础上再对小波系数进行阈值处理,仅保留阈值以上的数据,而后提取相关性不大的传统特征参数进行组合,分别作为说话人识别系统的输入矢量.仿真结果表明:在噪声环境中,说话人识别系统能较好识别出说话人,经过小波变换后再提取特征参数的方法可以得到更高的识别率,大大提高说话人识别系统的识别性能. 相似文献
6.
大学生闽南语说话人识别语音库的设计 总被引:1,自引:0,他引:1
王静芸 《厦门理工学院学报》2009,17(3):79-83
设计了一个包含120名在校大学生的闽南语说话人识别语音库.该语音库可以根据闽南语口音、说话人性别等条件来进行语音语料的查询.针对不同口音的说话人进行了一系列的GMM(Gaussian Mixture Speaker Model)说话识别实验,验证了特定口音模型比非特定口音模型的识别率一般要高10%左右. 相似文献
7.
《天津理工大学学报》2016,(6)
说话人识别面临许多实际困难,其中由于环境和采集通道因素导致信号不一致最具挑战性.在本文中,提出一种新的自适应小波收缩的抗噪声说话人识别方法.在小波收缩去噪的应用中,双阈值策略压缩抑制噪声,保留信号系数,用重叠语音信号端的梅尔倒谱系数的修正来识别.用两个公共可用的语音信号数据库来评价所提出的方法的有效性,并与其它方法相比.证明了所提出的方法在不同的噪声条件下具有更好的鲁棒性. 相似文献
8.
《河南大学学报(自然科学版)》2016,(5)
环境失配问题严重影响着说话人识别的性能,这一问题在非平稳噪音条件下表现得更为显著.为了增强说话人识别在环境失配条件下的鲁棒性,基于稀疏表示提出了一种高维鲁棒语音特征的生成方法,并针对上述高维语音特征的稀疏特性提出了一个说话人模型.在该说话人识别方法中,首先以优化的联合基作为稀疏表示的基,在此基础上对信号进行分解,用于从带噪语音中剥离噪音成分,并从中提取语音信号的内蕴时频结构;之后在此基础上提出了一种鲁棒的稀疏谱语音特征,并根据该特征的高维稀疏特性给出了基于混合k-means的说话人模型.实验结果显示,与基于梅尔倒谱系统特征的基线系统相比,提出的说话人识别方法在NIST SRE-2003语料库条件下的等错误率下降了28.16%,在Chinese-863语料库和不同信噪比(5dB和0dB)的非平稳汽车噪音环境下的等错误率分别下降了9.84%和14.21%.上述结果表明,在环境失配情况下,提出的说话人识别方法的性能明显优于基于梅尔倒谱系数特征的基线系统. 相似文献
9.
一种改进的新型说话人确认算法 总被引:1,自引:0,他引:1
在单芯片上实现的说话人确认系统是说话人识别应用的重要方向。该文面向片上应用,在使用DTW(dynamictime-warping)匹配方法的确认系统基础上提出一种改进的说话人确认算法,结合说话人确认的任务特点对DTW算法进行了改进:1)引入分层判决思想,2)在判决中结合单帧说话人区分能力估计,使系统的识别性能得到改进。新系统能够在对模板应用压缩处理后仍然保持良好的识别性能。测试表明新确认系统不做模板压缩时的等错误率为1.81%,经过1:8模板压缩处理后新系统的等错误率为2.35%。 相似文献
10.
说话人识别中语音特征参数研究 总被引:1,自引:0,他引:1
在说话人识别系统中,特征参数的选择和提取对系统的识别性能有关键性的影响。研究了两种重要的语音特征参数,线性预测倒谱系数和美尔倒谱系数,在此基础上提出改进的相位自相关系数,通过实验对几种参数进行了对比,结果表明改进的相位自相关系数能够使系统的误识率明显下降。 相似文献
11.
语音识别和说话人识别中各倒谱分量的相对重要性 总被引:37,自引:0,他引:37
采用增减特征分量的方法研究了MFCC各维倒谱分量对说话人识别和语音识别的贡献。使用DTW测度,在标准英文数字语音库上的实验表明,最有用的语音信息包含在MFCC分量C1到C12之间,最有用的说话人信息包含在MFCC分量C2到C16之间。MFCC分量C0和C1包含有负作用的说话人信息,将其作为特征会引起识别率的降低。低阶MFCC分量较高阶分量更容易受加性噪声和卷积噪声干扰。 相似文献
12.
听觉掩蔽门限在说话者识别中的应用 总被引:2,自引:0,他引:2
语音信息在人的听觉系统中的表示具有一定的冗余性.利用这一特性把丢失数据技术应用于噪声环境下说话者识别系统的性能改进.听觉掩蔽效应这一听觉现象被用来检测语音信号频谱中被噪声严重干扰的“丢失成分”.经过丢失数据补偿技术结合语音增强处理,说话者识别系统在不利环境下的准确率得到了提高.通过对宽带噪声- 白噪声和一种特殊噪声——汽车噪声干扰下语音的说话者辨认实验,发现这种方法优于单独使用语音增强方法. 相似文献
13.
江太辉 《五邑大学学报(自然科学版)》2003,17(1):23-26
将神经网络预测模型(NPM)应用于说话人识别中,经过实验,获得了较满意的结果。这说明神经网络对于说话人识别是一种很有潜力的方法。 相似文献
14.
研究的说话人识别系统,采用能够反映人对语音的感知特性的线性预测(LPC)倒谱参数作为特征参数,同时对特征参数各维分量的识别能力进行定量分析,采用一种新的加权方法进行矢量量化,在此方法下系统取得识别率很高的效果,而且计算量和存储量都比较低. 相似文献
15.
说话人识别的参量研究和语音库建设 总被引:4,自引:0,他引:4
本文对说话人识别中的几个基本问题进行了研究。语音参量是说话人识别的基础,用矢量量化方法,使用自建的语音库中的材料,研究了说话人识别中的各种参量的效果。实验表明,所采用的参量中,一种混合参量MC最好,倒谱系数CE次之。 相似文献
16.
一种抗噪声语音识别方法 总被引:2,自引:0,他引:2
本文提出了一种抗噪声语音识别新方法,并以这种方法为基础,在SUN工作站上实现了这一系统,实验结果表明,本文提出的方法提高了传统隐马柯夫模型语音识别器的抗噪性能。 相似文献
17.
文章研究了两种不同语音识别算法—动态时间伸缩算法(DTW)和隐马尔可夫模型(HMM),并在模式匹配原理的基础上,设计、实现了在Matlab环境中,应用DTW识别法及HMM识别法的孤立字语音识别实验平台。 相似文献
18.
常用的加权算法难以跟踪非常态语音特征的变异,为此,文中提出了一种变异特征加权的异常语音说话人识别算法.首先统计大量正常语音各阶MFCC特征的概率分布,建立正常语音特征模板;然后用测试语音特征与正常语音特征模板之间的K-L距离和欧氏距离来度量语音的变异程度,确定K-L加权因子和欧氏加权因子;最后利用加权因子对测试语音的MFCC特征进行加权,并将加权后的特征输入高斯混合模型进行异常语音说话人识别.实验结果表明,文中提出的K-L加权和欧氏加权的异常语音说话人识别算法的整体识别率分别为46.61%和42.25%,而基于各阶特征对说话人识别贡献的加权算法和不加权算法的整体识别率分别为39.68%和36.36%. 相似文献
19.
本文介绍了一个实时、有效的话者自动验证系统,重点对话者验证的机理进行了分析,并对与验证系统有关的几个主要问题作了简要的说明。该系统的主要特点是:选择了最能反映话者特征的基音和第二、三共振峰频率及其时变特性作为特征参数,有效地保证了系统验证的正确率;硬件上采用了以高速处理芯片C25作成的语音处理板,保证了话者验证中大量的计算工作的实时性;结构上将语音处理板作成PC机的插板形式,用户能通过PC机的友好人机接口对其实施各种有效的管理。目前该系统已在PC机上试制成功,初步测试表明达到了研制要求。 相似文献