首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
Mel频率倒谱系数(MFCC)是语音特征提取的一种常用方法。因其能够充分模拟人耳的听觉系统,具有较高的识别精度,所以在语音识别中得到了广泛的应用。本文针对MFCC在语音识别中对中高频区域识别精度不高的固有缺陷,通过将MFCC、Mid MFCC、IMFCC与主成分分析(PCA)相结合,提出了一种在全频域实现精确且快速的识别方法,并进行了仿真实验验证。  相似文献   

2.
在语音识别中最常提取的特征参数是Mel频率倒谱系数(MFCC)。但Mel频率倒谱系数不能很好的反映语音信号的动态特性。针对这种缺点,对常规的MFCC进行改进,采用小波变换替代MFCC提取过程中FFT变换,得到改进后的MFCC。采用这种方法后,识别率有了很大的提高。  相似文献   

3.
在语音情感识别系统中,语音情感特征的提取尤为重要,本文在前期已有对EMD分解研究的基础上,将EMD分解与Teager能量算子相结合,用于语音情感识别。文中首先利用EMD分解得到一组IMF分量,再对各阶IMF分量提取Teager能量,然后通过对不同语种的不同情感语音的Teager能量在Mel频率的分析,提出了一种新的情感特征:基于EMD分解的Mel频率的Teager能量谱系数(ETMC),最后利用SVM分类方法对不同语种的不同情感进行识别,实验结果表明,该方法有很好的识别结果。  相似文献   

4.
语音情感识别是人工智能领域的研究热点.对不同的特征参数提取直接影响了语音情感识别的效果.通过提取基频、共振峰和Mel频率倒谱系数三个能够充分反映语音情感的特征,采取支持向量机的方法对样本进行分类学习.实验结果表明这三种特征参数能够有效识别语音情感.  相似文献   

5.
MFCC(Mel Frequency Cepstrum Coefficient)是语音处理过程中需要提取的重要频率参数之一,因其很好地模仿人耳的听觉感知,在各种语音识别和合成过程中得到广泛的应用。文章在分析标准的MFCC参数提取算法基础上,通过合并参数算法提取了藏语语音的MFCC,并给出了在Matlab里进行仿真实验的详细步骤。  相似文献   

6.
基于MFCC和GMM的个性音乐推荐模型   总被引:1,自引:1,他引:0  
提出一种基于Mel频率倒谱系数(MFCC)和高斯混合模型(GMM)的个性音乐推荐模型的建立方法.该方法采用MFCC技术提取歌曲的语音特征,并利用GMM算法生成该歌曲的模板,然后利用音乐模板库对音乐文件进行相似度计算.实验结果表明,利用该模型为用户推荐的歌曲平均准确率为90%.  相似文献   

7.
Mel频率倒谱系数在语音识别中是常用的特征参数之一。本文对Mel频率倒谱系数(Mel-Frequency Cepstrum Coefficient,MFCC)的提取过程进行了详细分析,找出其两个主要的缺点。并使用线性预测倒谱系数(Linear Prediction Cepstrum Coefficient,LPCC)和小波变换分别对其两个不同的缺点进行了改进。  相似文献   

8.
根据语音发声过程中的混沌特性,应用非线性动力学模型分析情感语音信号,提取了该模型下情感语音信号的非线性特征以及常用的声学特征(韵律特征和MFCC).设计情感语音识别对比实验,将非线性特征与不同声学特征融合并验证了该组合下的情感识别性能,研究了语音信号混沌特性对情感语音识别性能的影响.实验选用德国柏林语音库4种情感(高兴、愤怒、悲伤和中性)作为语料来源,支持向量机网络用于情感识别.结果表明,非线性特征有效表征了情感语音信号的混沌特性,与传统声学特征结合后,情感语音识别性能得到了显著提高.  相似文献   

9.
针对Mel频率倒谱系数(Mel frequency cepstralcoefficient,MFCC)特征的说话人确认系统在干净语音环境下具有很高识别率但在噪音环境下识别率急剧下降的缺点,构建了基于感知对数面积比系数(perceptual log area ratio,PLAR)特征的说话人确认系统,并对该系统的噪音鲁棒性进行研究。结果表明:PLAR特征具有较强的噪音鲁棒性。将PLAR与MFCC进行特征域和分数域的融合,利用两者之间存在着的互补性,可有效提高说话人确认系统的识别性能。  相似文献   

10.
语音的特征提取是说话人识别系统中的关键问题。在传统的Mel频率倒谱系数(MFCC)参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行平滑处理,得到信号的谱包络。然后对信号的谱包络进行计算,得到改进的MFCC参数。实验表明,在不同噪声环境下,与传统的MFCC算法相比,改进的算法识别率提高四个百分点以上。  相似文献   

11.
基于传统的Mel倒谱系数(MFCC)系列特征的语音识别系统在噪声环境中的识别性能会急剧下降。为了进行噪声环境中的自动语音识别,提出了一种反映语音信号谐振程度的特征:谐振强度,并用之代替传统MFCC特征中的能量维(零维倒谱C0,或者帧能量E)。在展览馆噪声、人群噪声和汽车噪声等情况下的语音识别实验结果表明:基于这种新特征的语音识别系统比基于传统特征的语音识别系统有更高的平均识别率和更好的抗噪声能力。  相似文献   

12.
建立了普通话语音性别数据库,提出联合梅尔频率频谱系数(Mel-frequency CepstrumCoefficients,MFCC)的特征提取方法和支持向量机(Support Vector Machine,SVM)的分类方法进行说话人性别识别,并与其它分类方法进行比较,实验结果表明该方法的说话人性别识别准确率达到98.7%,明显优于其它分类器。  相似文献   

13.
为了有效提取语音特征,提高说话人识别的准确率,系统采用基于有限状态机的端点检测算法对原始语音做VAD处理,提出了新的特征组合参数:基于人的听觉特性的MFCC参数、基于发音生理特征的基音轮廓特征以及衍生的基音周期一阶差分、基音周期变化率,并将它们作为说话人识别系统的特征参数,建立了基于VQ的识别模型.实验表明:本文系统使用VAD,使系统的识别率提高了5%8%,较单独使用MFCC参数的说话人识别系统的识别率提高了2%3%.  相似文献   

14.
说话人识别中改进的MFCC参数提取方法   总被引:1,自引:0,他引:1  
何朝霞 《科学技术与工程》2011,18(18):4215-4218,4227
在说话人识别技术中,特征参数的提取对语音训练和识别有着非常重要的作用。而Mel频标倒谱系数MFCC是一种常用的特征,它能对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,获得影响语音识别的重要信息。同时由于语音信号具有时变和混沌特性,以非线性随机共振理论和人类对听觉的理解为基础,提出了一种基于随机共振的MFCC特征参数提取方法。通过实验比较两种方法的结果,论证了改进方法的可行性以及优越性,为说话人识别技术中特征参数提取提供了一条新的研究方向。  相似文献   

15.
基于非线性共振的说话人特征提取研究与仿真   总被引:1,自引:1,他引:0  
何朝霞  潘平 《科学技术与工程》2012,12(25):6507-6510
针对人发声系统的非线性特性和语音信号的类混沌特性,提出了一种基于非线性共振Duffing模型的说话人语音信号的特征提取方法。实验结果表明:采用非线性共振Duffing模型的特征提取方法,较基于非线性动力学提取广义维数特征具有较高的识别率。同时,同一语音信号在相同的识别系统中,与经典的MFCC特征相比,也具有较高的识别率。  相似文献   

16.
郑文宾  何蔚 《科学技术与工程》2023,23(17):7444-7449
随着人工智能和大数据的发展,各种场景中对异常声音识别的需求日益增长,基于人工智能的声音识别技术正在兴起并被高度重视。现行主流的异常声音识别算法多为浅层机器学习模型结构,对异常声音的识别率较低,且识别的声音类型单一。为了有效识别异常声音,提出一种基于梅尔频率倒谱系数(Mel-frequency cepstral coefficient, MFCC)和卷积神经网络(convolution neural network, CNN)的环境声音识别算法,对各类异常声音进行采集和有效识别,并及时反馈声音状态,为各类声识别应用场景提供精细化管理技术手段。结果表明:提出的算法对5类场景下环境异常声音的识别率得到极大提高,适用于更广泛的声学场景,具有明显的优势。  相似文献   

17.
针对Mel频率倒谱系数(MFCCs)信息在区分音频信号时的局限性,提出一种基于不同特征提取技术的两级分类策略,对智能保健监测系统的9种音频信号进行分类。分类的第一级采用MFCCs及其变化率(ΔMFCCs)作为隐马尔可夫模型(HMM)的输入。在第二级,将不同频段的功率谱密度的一阶差分均值和标准差作为分类的特征。实验结果表明,功率谱密度的一阶差分包含了MFCCs所不含有的重要分类信息,该方法使得实时保健监测系统的平均分类准确度高达97.37%,具有较好的鲁棒性和分类准确性。  相似文献   

18.
Mel 频率下基于 LPC 的语音信号深度特征提取算法   总被引:1,自引:0,他引:1  
针对传统语音信号二次特征提取方法在保证识别率的前提下,实时性较差的问题,提出一种Mel频率下基于线性预测系数(linear predictive coefficient,LPC)的改进的语音信号深度特征提取算法.该方法根据人耳的听觉特性把LPC在Mel频率下进行非线性变换,再进行微分、高阶微分和按比例重组等步骤,得到一种既考虑声道激励又兼顾人耳听觉的新特征参数,从而大大减少传统语音信号深度特征提取的计算量,在不影响识别效率的情况下,极大提高系统的实时性.最后,将该算法在智能轮椅平台进行有效性验证,大量实验表明,语音控制系统实时性差的问题在使用该算法后能够得到明显改善,该算法既保证了特征提取识别率,也有效地改善了系统的实时性.在一定程度上使语音控制智能轮椅更具实用性.  相似文献   

19.
Improved MFCC-Based Feature for Robust Speaker Identification   总被引:2,自引:0,他引:2  
The Mel-frequency cepstral coefficient (MFCC) is the most widely used feature in speech and speaker recognition. However, MFCC is very sensitive to noise interference, which tends to drastically degrade the performance of recognition systems because of the mismatches between training and testing. In this paper, the logarithmic transformation in the standard MFCC analysis is replaced by a combined function to improve the noisy sensitivity. The proposed feature extraction process is also combined with speech enhancement methods, such as spectral subtraction and median-filter to further suppress the noise. Experiments show that the proposed robust MFCC-based feature significantly reduces the recognition error rate over a wide signal-to-noise ratio range.  相似文献   

20.
采用模式匹配的识别技术,建立孤立词语音识别系统,基于MATLAB环境对O~9这10个数字语音进行仿真实验.在提取MFCC的基础上,整合差分倒谱参数作为语音的特征参数,并对现有的DTW算法加以改进,节省了系统匹配的计算时间,使其具有一定的鲁棒性.分别采集普通话语音和湖北、闽南、安徽3地方言的语音数据,体现了数据的完备性和系统的适用性.实验结果表明,基于改进型DTW算法和MFCC的语音识别系统具有较高识别率,取得了良好效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号