首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
为了提高低信噪比下语种识别的准确率,引入一种新的特征提取融合方法.?在前端加入有声段检测,并基于人耳听觉感知模型提取伽玛通频率倒谱系数(Gammatone?Frequency?Cepstrum?Coefficient,GFCC)特征,通过主成分分析对特征进行压缩、降噪,融合每个有声段的Teager能量算子倒谱参数,通过...  相似文献   

2.
在语音识别中最常提取的特征参数是Mel频率倒谱系数(MFCC)。但Mel频率倒谱系数不能很好的反映语音信号的动态特性。针对这种缺点,对常规的MFCC进行改进,采用小波变换替代MFCC提取过程中FFT变换,得到改进后的MFCC。采用这种方法后,识别率有了很大的提高。  相似文献   

3.
阐述了Mel谱失真测度的概念,指出用Mel频率尺度可较充分地反映人耳对频率及幅度的非线性感知特性。在此基础上,针对孤立词语音识别,对常规LP倒谱特征提取方法进行改进,即将LP倒谱按符合人耳听觉特性的Mel尺度进行非线性变化,得到LP Mel倒谱系数(LPM-CC)作为特征参数。识别网络使用RBF神经网络,进行了孤立词语音识别。实验结果表明此种方法抗噪性能好,识别效率高。  相似文献   

4.
随着科学技术尤其是计算机技术的不断发展,语音识别被广泛应用到各个领域.针对方向指令的语音,使用梅尔倒谱系数(Mel-Frequency Cepstrum Coefficient,MFCC)作为特征参数,连续马尔科夫模型(Continuous Hidden Markov Model,CHMM)作为识别模型,对语音信号进行识别处理.实验结果显示,此方法在方向指令语音识别中取得了良好的结果,有较高的识别准确率.  相似文献   

5.
针对Mel频率倒谱系数(Mel frequency cepstralcoefficient,MFCC)特征的说话人确认系统在干净语音环境下具有很高识别率但在噪音环境下识别率急剧下降的缺点,构建了基于感知对数面积比系数(perceptual log area ratio,PLAR)特征的说话人确认系统,并对该系统的噪音鲁棒性进行研究。结果表明:PLAR特征具有较强的噪音鲁棒性。将PLAR与MFCC进行特征域和分数域的融合,利用两者之间存在着的互补性,可有效提高说话人确认系统的识别性能。  相似文献   

6.
MFCC(Mel Frequency Cepstrum Coefficient)是语音处理过程中需要提取的重要频率参数之一,因其很好地模仿人耳的听觉感知,在各种语音识别和合成过程中得到广泛的应用。文章在分析标准的MFCC参数提取算法基础上,通过合并参数算法提取了藏语语音的MFCC,并给出了在Matlab里进行仿真实验的详细步骤。  相似文献   

7.
分析了目前各种语音质量的客观评价方法,提出了一种改进的基于动态分帧技术并与MFCC(Mel Frequency Cepstral Coefficient)参数结合的谱失真参数MDCD(Mean Dynamic Mel-cepstrum Distance)来映射主观语音的MOS分.实验表明,采用新参数的主客观曲线拟合效果优于传统参数CD(Cepstrum Distance).文中最后用MDCD参数来重新评价某些信息隐藏算法的透明性.  相似文献   

8.
提出了一种利用加权Mel倒谱提取语音信号共振峰的算法.首先对短时语音信号进行加权Mel倒谱分析,获得包含频谱主要成分的加权Mel倒谱系数;然后利用离散余弦平滑算法,从加权Mel倒谱系数获得谱包络,并从谱包络的峰值位置获得候选共振峰;最后根据共振峰的连续性约束条件和频率范围,从候选共振峰筛选得到共振峰的估计值.实验结果表明,本算法比倒谱法提取的共振峰误差更小,在噪声环境下具有较好的鲁棒性.  相似文献   

9.
针对传统语音端点检测方法在噪声环境下鲁棒性较差以及对语音段检测效果不佳的问题,提出一种多特征融合的语音端点检测方法.首先,提取带噪语音信号的子带谱熵特征和基于Mel频率倒谱系数(Mel Frequency Cepstral Coefficient, MFCC)的投影特征,并将Gammatone频率倒谱系数的第一维系数GFCC0特征应用到语音端点检测任务中;然后,对3类特征进行自适应加权融合,得到适用于端点检测的融合特征;最后,采用模糊C均值聚类自适应估计门限阈值,再通过双门限法得到端点检测的结果.所提方法和已有传统方法相比,在7种噪声环境下均取得了更好的端点检测结果,提升了语音端点检测的准确率,特别是在volvo噪声环境下的端点检测准确率可以达到94.5%以上.  相似文献   

10.
Mel频率倒谱系数提取及其在声纹识别中的作用   总被引:8,自引:0,他引:8  
从说话人的语音信号中提取出说话人的个性特征是声纹识别的关键。本文介绍了一种基于HMM的声纹识别系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)作为特征参数,取得了很好结果。  相似文献   

11.
提出一种基于MFCC和共振峰频率特征的汉语普通话口音识别方法.该方法首先提取Mel频率倒谱系数(MFCC)和共振峰频率特征作为混合高斯模型(GMM)的输入,然后采用期望最大化(EM)算法训练模型,对两种特征分别建模,最后采用基于最大似然准则(ML)的信息融合策略进行口音判别.实验数据库为7个地区的语音数据.经过交叉验证,该方法对于中国典型地区普通话口音的识别率达到85.61%,比单一使用MFCC特征或共振峰频率特征分别提高了6.62%和32.90%.  相似文献   

12.
基于MFCC的语音情感识别   总被引:4,自引:0,他引:4  
情感语音中携带着丰富的信息,在人机交互领域有着广阔的应用.Mel频率是基于人耳听觉特性提出来的.它与Hz频率成非线性对应关系.Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征,MFCC已经广泛地应用在语音识别领域.由于Mel频率与Hz频率之间非线性的对应关系,使得MFCC随着频率的提高,其计算精度随之下降.因此,在应用中常常只使用低频MFCC,而丢弃中高频MFCC.针对该问题进行了研究,修正了Hz-Mel非线性对应关系,提升了中高频系数的计算精度,并将其作为低频MFCC的补充,应用到语音情感识别中.实验证明,改进之后的算法与经典算法比较,在不同的特征组合上识别率都有不同程度的提高,从而证明了Mid MFCC特征计算方法的有效性.  相似文献   

13.
基于MFCC和GMM的个性音乐推荐模型   总被引:1,自引:1,他引:0  
提出一种基于Mel频率倒谱系数(MFCC)和高斯混合模型(GMM)的个性音乐推荐模型的建立方法.该方法采用MFCC技术提取歌曲的语音特征,并利用GMM算法生成该歌曲的模板,然后利用音乐模板库对音乐文件进行相似度计算.实验结果表明,利用该模型为用户推荐的歌曲平均准确率为90%.  相似文献   

14.
为了辅助电网涉鸟故障的差异化防治,提出一种基于组合特征和卷积神经网络 (Convolutional Neural Network,CNN)的电网危害鸟种鸣声识别方法 . 根据历史涉鸟故障的鸟 种信息及输电线路周边鸟种调查结果,选择13种高危鸟类、8种微害鸟类和2种无害鸟类建立 鸣声样本集;对鸟种鸣声信号进行分帧、加窗、降噪和剪裁等预处理,提取鸟鸣 Mel 倒谱系数 (Mel-frequency Cepstrum Coefficients,MFCC)、Gammatone 倒 谱 系 数(Gammatone Frequency Cepstrum Coefficients,GFCC)和短时能量(Short-term Energy,STE)特征 . 针对单一特征表达能 力不足的问题,将MFCC及其一阶差分、GFCC及其一阶差分和STE归一化后进行组合,生成新 的鸣声特征集 . 搭建卷积神经网络模型对组合特征进行训练和识别,鸟种鸣声测试集的识别 正确率达91.8%,较单一MFCC和GFCC特征表现更为优异.  相似文献   

15.
语音的特征提取是说话人识别系统中的关键问题。在传统的Mel频率倒谱系数(MFCC)参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行平滑处理,得到信号的谱包络。然后对信号的谱包络进行计算,得到改进的MFCC参数。实验表明,在不同噪声环境下,与传统的MFCC算法相比,改进的算法识别率提高四个百分点以上。  相似文献   

16.
电话信道下应用DMFCC进行说话人识别   总被引:2,自引:0,他引:2  
鉴别性Mel频率倒谱系数(DMFCC)是一种修正的Mel频率倒谱系数(MFCC),其更加强调语音频谱各个子带携带的鉴别性信息,采用自适应的非均匀的滤波器组设置。在宽带信号应用中,DMFCC的作用和效果已经被证明;但在窄带信号应用中,DMFCC还鲜见有成功应用的例子。该文在电话信道下对应用DMFCC进行说话人识别研究,在美国国家标准技术研究院(NIST)2006年说话人识别评测Female核心测试集上,以MFCC作为特征参数的系统的等错误率为7.57%,以DMFCC作为特征参数的系统的等错误率为7.25%,而采用基于逻辑自回归的线性融合方法把基于两种不同特征的系统在分数域进行融合后系统的等错误率可达到6.31%,相对于基于MFCC的系统等错误率下降16.6%。实验表明,在电话信道下直接应用DMFCC可小幅度提高性能;理论分析以及实验结果表明:二者存在一定的互补性,即把DMFCC和MFCC融合应用能够大幅度提高电话信道下说话人识别的性能。  相似文献   

17.
基于传统特征的行车声音端点检测法存在重叠有车段识别率低、双门限阈值较难确定的问题,针对这两个问题,探索性地将梅尔频率倒谱系数(Mel frequency cepstral coefficients,MFCC)倒谱距离特征和短时能量特征进行了融合并应用于交通量检测。首先选取了周围环境较为安静的一个双车道路段,并采集了该路段上包含重叠有车段的行车声音;其次提取了行车声音的短时能量特征和MFCC倒谱距离特征,并对它们在端点检测中的优劣进行了分析对比;再次提出了一种融合短时能量特征和MFCC倒谱距离特征的新特征,并基于新特征将传统的双门限判决思路改进成了单门限判决思路;最后利用新特征对有车段进行端点检测并统计交通量。实验结果表明:基于融合特征的端点检测方法能有效解决重叠有车段识别率低和双门限阈值较难确定的问题。  相似文献   

18.
正音反馈的计算机辅助对外汉语发音训练系统已有发音偏误趋势的标注体系和基于HMM的偏误趋势检测系统。为了进一步提高系统的性能,该文应用深度神经网络进行声学建模,比较Mel频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)、感知线性预测分析系数(perceptual linear predictive analysis,PLP)和Mel滤波器组系数(Mel filter bank,FBank)3种声学特征参数,并利用网格联合技术整合3种声学特征所得的候选网格。实验结果表明:DNN-HMM模型比GMM-HMM实现了更高检测正确率。针对不同发音偏误趋势,3种声学特征有不同表现,联合系统取得最高性能,最终性能为:错误拒绝率5.5%,错误接受率35.6%,检测正确率88.6%。  相似文献   

19.
为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数(MFCC)与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进行实验测试,并比较了不同高斯混合数的MFCC特征参数组合对识别率的影响。结果表明:使用改进的MFCC混合参数明显地提高了说话人的识别率。  相似文献   

20.
RASTA滤波在语音通信质量客观评价中应用的研究   总被引:2,自引:0,他引:2  
介绍了在语音通信质量客观评价中使用RASTA(Relative Spectra)滤波的研究结果。通过分别将RASTA滤波与感知线性预测(PLP,Perceptually Linear Prediction)方法和美倒谱(MFCC,Mel Frequency Cepstral Coefficient)方法相结合对通过短波或超短波信道的男女生文件进行拟合研究,均取得了比较好的效果。与PLP方法结合关系数提高了12%,与MFCC方法结合相关系数提高了4%。说明RASTA滤波对信道噪声的低频成分中人耳听不到的部分进行过滤的方法在语音通信质量客观评价中是有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号