期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王婧张良《科技信息》2009,(1)

Mel频率倒谱系数MFCC在说话人识别中已被广泛使用。本文以MFCC为声音信号的特征参数提取的标准。识别部分采用自组织神经网络的方法进行建模,实验结果表明该方法有较高的识别率。相似文献

2.

王若平李仁仁陈达亮王东房宇《科学技术与工程》2019,19(36):290-295

随着自动驾驶汽车研究的不断深入,对其环境感知系统提出了更高的要求。为了使自动驾驶汽车适应更复杂的交通环境,本文研究了低信噪比声学环境感知技术,提出改进的小波包去噪方法;采用经验模态分解(EMD)的方法改进梅尔频率倒谱系数(MFCC)的提取;采用支持向量机(SVM)识别模型完成低信噪比交通环境声音识别。实验结果表明,本文提取的去噪方法提高声音事件信噪比的同时保持声音特征,且对噪声有自适应性;改进的MFCC提取方法一定程度上提高了特征参数的抗噪性能。通过对低信噪比交通环境声音去噪和特征参数优化后,其平均识别率比优化前提高了33.34%,并改变了识别率骤降的趋势。相似文献

3.

声纹识别特征MFCC的提取方法研究 总被引：1，自引：0，他引：1

王华朋杨洪臣《中国人民公安大学学报(自然科学版)》2008,14(1):28-30

目的:研究声纹识别在人的个体生物特征识别中的应用。方法:利用符合人听觉特性的语音特征参量MFCC作为识别特征,并且在Matlab平台上对MFCC的提取算法进行了详细的阐述和程序设计。结果:在实际应用中取得了较高的识别率。结论:采用MFCC作为特征参数进行声纹识别,其正确率比用LPC等作为特征参数有较大的改善。相似文献

4.

基于MFCC特征组合参数的说话人识别研究

曾霞霞徐戈吴征远《集美大学学报(自然科学版)》2016,(4):317-320

为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数（MFCC）与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进行实验测试,并比较了不同高斯混合数的MFCC特征参数组合对识别率的影响。结果表明:使用改进的MFCC混合参数明显地提高了说话人的识别率。相似文献

5.

管制指令特征参数提取研究 总被引：2，自引：1，他引：1

何昕蒋豪韩丹《科学技术与工程》2015,15(20)

在管制指令语音识别系统的研究中,语音的特征参数提取方法是影响系统识别率的关键因素之一。在Matlab平台上基于MATLAB GUI技术,设计完成HMM语音训练识别模型的用户操作界面,实现特征参数提取方法的选择、语音信号的训练、识别操作及结果输出和波形显示。通过实例对比分析,特定人和非特定人情况下,LPCC和MFCC两种特征参数提取方法在训练、识别时间和识别率上的差异。结果表明,特定人时LPCC参数的识别优势明显;非特定人时,MFCC参数的识别效果和效率更好。相似文献

6.

基于用小波变换改进MFCC的语句识别方法

《科技信息》2008,(14)

在语音识别中最常提取的特征参数是Mel频率倒谱系数(MFCC)。但Mel频率倒谱系数不能很好的反映语音信号的动态特性。针对这种缺点,对常规的MFCC进行改进,采用小波变换替代MFCC提取过程中FFT变换,得到改进后的MFCC。采用这种方法后,识别率有了很大的提高。相似文献

7.

基于改进型DTW算法和MFCC的语音识别

陈孟元《安徽工程科技学院学报：自然科学版》2014,(1):53-57

采用模式匹配的识别技术,建立孤立词语音识别系统,基于MATLAB环境对O～9这10个数字语音进行仿真实验．在提取MFCC的基础上,整合差分倒谱参数作为语音的特征参数,并对现有的DTW算法加以改进,节省了系统匹配的计算时间,使其具有一定的鲁棒性．分别采集普通话语音和湖北、闽南、安徽3地方言的语音数据,体现了数据的完备性和系统的适用性．实验结果表明,基于改进型DTW算法和MFCC的语音识别系统具有较高识别率,取得了良好效果．相似文献

8.

声音转换实验系统的研究与实现

刘金凤符敏程德福《南京理工大学学报(自然科学版)》2005,29(Z1):211-214

声音转换是将源说话人的声音转化成具有目标说话人特征信息的声音的方法。该系统选择共振峰频率和带宽及基音周期等声音特征参数,分别使用LPC求根法和自相关法提取这些特征参数。矢量量化的码本映射方法实现声音特征转换,共振峰参数法合成转换语音。实验中对5个国际音标与语音中的元音进行转换,并使用MFCC听觉倒谱法对转换结果进行评估,其中男声到女声的转换后的语音到目标语音的MFCC距离比源语音到目标语音MFCC距离平均减小48.8%。相似文献

9.

说话人识别技术——语音特征参数提取及组合

张喜宁《科技资讯》2009,(34):231-232

本论文重点对语音特征参数的组合进行了研究,通过参数的特征组合从不同的角度来反映说话人的个性特征,能够大大提高说话人识别系统的识别率。对其中的特征参数（MFCC及LPCC）的特性及提取过程进行了详细的解释和仿真。相似文献

10.

基于MFCC等组合特征的说话人识别模型

朱建伟孙水发刘晓丽《三峡大学学报(自然科学版)》2009,31(6):77-79,93

为了有效提取语音特征,提高说话人识别的准确率,系统采用基于有限状态机的端点检测算法对原始语音做VAD处理,提出了新的特征组合参数：基于人的听觉特性的MFCC参数、基于发音生理特征的基音轮廓特征以及衍生的基音周期一阶差分、基音周期变化率,并将它们作为说话人识别系统的特征参数,建立了基于VQ的识别模型.实验表明：本文系统使用VAD,使系统的识别率提高了5%8%,较单独使用MFCC参数的说话人识别系统的识别率提高了2%3%. 相似文献

11.

基于特征融合方法的车型识别研究

赵宏旭《科学技术与工程》2018,18(18)

车辆音频信号具有复杂的特征,单一特征提取方法不能全面反应该特点。为了使提取的音频信号特征能更好地反映车辆原始信号,本文提出了将已有的短时能量(ENERGY)、短时傅里叶变换（STFT）及梅尔倒谱系数（MFCC）特征提取方法进行融合的方法,依据支持向量机（SVM）的分类识别算法,达到车辆识别的目的。实验表明,提出的组合方法优于单一提取方法,实现了提高识别率的目标,其中,ENERGY+MFCC组合方式效果最好。相似文献

12.

说话人识别中改进的MFCC参数提取方法 总被引：1，自引：0，他引：1

何朝霞《科学技术与工程》2011,18(18):4215-4218,4227

在说话人识别技术中,特征参数的提取对语音训练和识别有着非常重要的作用。而Mel频标倒谱系数MFCC是一种常用的特征,它能对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,获得影响语音识别的重要信息。同时由于语音信号具有时变和混沌特性,以非线性随机共振理论和人类对听觉的理解为基础,提出了一种基于随机共振的MFCC特征参数提取方法。通过实验比较两种方法的结果,论证了改进方法的可行性以及优越性,为说话人识别技术中特征参数提取提供了一条新的研究方向。相似文献

13.

基于一种新特征参数的说话人识别

陈若珠曾番李战明《兰州理工大学学报》2008,34(1):68-71

针对传统的特征参数Mel频域倒谱系数MFCC难以满足语音信号的非平稳性问题,提出一种基于小波分析的新特征参数FPBW的提取方法.为了提高训练速度,采用正交高斯混和模型,将正交变换改到最大期望EM算法之前进行,从而减少训练时间.实验结果表明,新的特征参数FPBW优于特征参数MFCC,并且采用正交高斯混合模型进一步提高了识别性能和训练速度. 相似文献

14.

基于多窗频谱估计和平滑幅度谱包络的MFCC改进算法 总被引：1，自引：0，他引：1

张怡然白静王力《科学技术与工程》2014,14(19)

语音的特征提取是说话人识别系统中的关键问题。本文在传统的MFCC参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行平滑处理,得到信号的谱包络。然后对信号的谱包络进行计算,得到改进的MFCC参数。实验表明,在不同噪声环境下,与传统的MFCC算法相比,改进的算法识别率提高四个百分点以上。相似文献

15.

2D-Haar声学特征超向量快速生成方法

谢尔曼罗森林潘丽敏《北京理工大学学报》2016,36(3):295-301

针对大数据量音频的高速处理,提出一种快速的声学特征超向量生成方法,有效提高音频识别系统的识别速度和精度.所提方法首先将多个连续音频帧的常用声学特征构成声学特征图,进而使用低复杂度的运算方法在其中快速提取维数达数十万的Haar-like声学特征;然后使用AdaBoost.MH算法,筛选出具有较高代表性的Haar-like声学特征模式组合,用以构成声学特征超向量;进而提出Random AdaBoost特征筛选方法,进一步提高特征筛选速度.实验结果表明,在音频事件识别、说话人识别、说话人性别识别3种场合下,使用Haar-like声学特征可以使SVM、C5.0、AdaBoost等识别算法获得比MFCC、PLP、LPCC等常用声学特征更高的识别准确率,同时可以获得7~20倍的训练速度提升和5~10倍的识别速度提升. 相似文献

16.

基于LDA-MFCC的藏语语音特征提取技术研究

普次仁顿珠次仁《西藏大学学报》2014,(2):44-47

藏语特征提取算法是藏语语音识别系统中最为关键的一个环节。文章在分析藏语发音特点的基础上,建立了基于模拟人耳听觉系统的Mel倒谱系数（MFCC）特征提取算法,然后通过LDA信息压缩算法,对提取的特征数据进行压缩,在降低维数的同时提高了识别率和运算效率,总结出了符合藏语语音特点的LDA-MFCC特征提取算法。相似文献

17.

基于非线性共振的说话人特征提取研究与仿真 总被引：1，自引：1，他引：0

何朝霞潘平《科学技术与工程》2012,12(25):6507-6510

针对人发声系统的非线性特性和语音信号的类混沌特性,提出了一种基于非线性共振Duffing模型的说话人语音信号的特征提取方法。实验结果表明:采用非线性共振Duffing模型的特征提取方法,较基于非线性动力学提取广义维数特征具有较高的识别率。同时,同一语音信号在相同的识别系统中,与经典的MFCC特征相比,也具有较高的识别率。相似文献

18.

特定类型音频流泛化识别方法 总被引：2，自引：2，他引：0

罗森林李金玉潘丽敏《北京理工大学学报》2011,31(10):1231-1235

提出一种基于Mel频率倒谱系数(MFCC)和AdaBoost算法的特定类型音频流泛化识别方法,通过分析特定类型音频流的子类别间的共性和差异性,利用共性特征进行泛化识别,能够准确地检测并定位音频流中特定类型的音频.文中将枪声作为特定类型音频进行研究,通过提取各种枪声子类别的共性,弱化子类间的差异得到一个泛化的枪声模板,利用一个模板就可以支持多子类的准确识别.实验结果表明,算法的识别准确率为87.6%,查全率达到91.8%. 相似文献