首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 137 毫秒
1.
语音的特征提取是说话人识别系统中的关键问题。在传统的Mel频率倒谱系数(MFCC)参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行平滑处理,得到信号的谱包络。然后对信号的谱包络进行计算,得到改进的MFCC参数。实验表明,在不同噪声环境下,与传统的MFCC算法相比,改进的算法识别率提高四个百分点以上。  相似文献   

2.
藏语特征提取算法是藏语语音识别系统中最为关键的一个环节。文章在分析藏语发音特点的基础上,建立了基于模拟人耳听觉系统的Mel倒谱系数(MFCC)特征提取算法,然后通过LDA信息压缩算法,对提取的特征数据进行压缩,在降低维数的同时提高了识别率和运算效率,总结出了符合藏语语音特点的LDA-MFCC特征提取算法。  相似文献   

3.
选取ETSI语音增强系统作为研究对象.该系统使用传统维纳滤波方法,在信噪比较高时降噪性能优秀,但在信噪比较低的情况下,降噪能力弱,对于脉冲噪声无较好抑制.而模拟人耳听觉特性的计算听觉场景分析技术能够比较好地弥补这一缺陷.故在ETSI算法的基础上,结合计算听觉场景分析技术,提出一种新的算法,将维纳滤波器参数估计由原本的Mel域变换到Gammatone域,并进一步利用理想率掩蔽估计对带噪信号进行信噪分离,抑制脉冲噪声.该算法在TIMIT语音库上进行了实验,结果证明,与原算法相比,提出的新算法使听觉质量在低信噪比下提升较大,脉冲噪声抑制亦明显.在低信噪比的情况下,后端语音识别系统的识别率得到提升.  相似文献   

4.
针对语音信号特征提取在处理含噪语音信号时识别率低,抗干扰性差等问题,提出了一种基于改进的经验模态分解算法对含噪语音信号进行特征提取.该方法通过对含噪声语音信号分解分类并对两类模态分量分别处理再进行重构和特征提取,解决了目前大多数语音信号特征提取过程会滤掉部分原信号问题,在有效地消除了噪声信号的基础上,尽可能多地保存原信号,进而使系统的识别性能得到明显提高.实验结果表明,该算法在不添加噪声的情况下可以达到95.5%识别率,在添加不同比例噪声时,相比于几种传统算法,该算法依然保持高识别率.  相似文献   

5.
阐述了Mel谱失真测度的概念,指出用Mel频率尺度可较充分地反映人耳对频率及幅度的非线性感知特性。在此基础上,针对孤立词语音识别,对常规LP倒谱特征提取方法进行改进,即将LP倒谱按符合人耳听觉特性的Mel尺度进行非线性变化,得到LP Mel倒谱系数(LPM-CC)作为特征参数。识别网络使用RBF神经网络,进行了孤立词语音识别。实验结果表明此种方法抗噪性能好,识别效率高。  相似文献   

6.
声纹识别的重点在于将说话人的个性特点从说话人的语音信号中成功提出出来,声波频率不同,人耳对其的听觉灵敏度也有所区别。本文首先介绍了传统特征提取及其计算过程,针对其存在的不足提出相应的完善建议,最后通过实验对改进后的特征提取算法的识别率加以验证。  相似文献   

7.
基于DBN的sEMG智能轮椅人机交互系统   总被引:1,自引:0,他引:1  
设计了基于表面肌电信号的智能轮椅人机交互系统,首先通过CyberLink肌电传感器,对面部运动信号进行采集与分析处理,采用了深度信任网络(deep belief network,DBN)算法对肌电信号进行分类,进而用于智能轮椅的运动控制.实验表明:与支持向量机相比,用深度信任网络训练肌电信号,能有效地处理大量的肌电样本信号,并得到最高可达95.25%的识别率,提高了肌电信号的识别率、有效降低了对大量数据的处理时间、增强了智能轮椅响应的实时性.  相似文献   

8.
Mel频率倒谱系数(MFCC)是语音特征提取的一种常用方法。因其能够充分模拟人耳的听觉系统,具有较高的识别精度,所以在语音识别中得到了广泛的应用。本文针对MFCC在语音识别中对中高频区域识别精度不高的固有缺陷,通过将MFCC、Mid MFCC、IMFCC与主成分分析(PCA)相结合,提出了一种在全频域实现精确且快速的识别方法,并进行了仿真实验验证。  相似文献   

9.
采用基于听觉特性的Mel频率倒谱系数作为说话人识别特征参数,对概率神经网络进行了描述,并使用该网络进行了文本无关说话人识别研究.实验表明,对20名说话人,用7秒语音训练,3秒语音识别时,该方法可达到96.7%的正确识别率.  相似文献   

10.
基于MFCC的语音情感识别   总被引:4,自引:0,他引:4  
情感语音中携带着丰富的信息,在人机交互领域有着广阔的应用.Mel频率是基于人耳听觉特性提出来的.它与Hz频率成非线性对应关系.Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征,MFCC已经广泛地应用在语音识别领域.由于Mel频率与Hz频率之间非线性的对应关系,使得MFCC随着频率的提高,其计算精度随之下降.因此,在应用中常常只使用低频MFCC,而丢弃中高频MFCC.针对该问题进行了研究,修正了Hz-Mel非线性对应关系,提升了中高频系数的计算精度,并将其作为低频MFCC的补充,应用到语音情感识别中.实验证明,改进之后的算法与经典算法比较,在不同的特征组合上识别率都有不同程度的提高,从而证明了Mid MFCC特征计算方法的有效性.  相似文献   

11.
本文对数字语音信号s(n)在语音识别过程中的信号预处理阶段使用加窗函数w(n),从引入误差到LPC分析的实用性算法进行了分析,对使用w(n)的必要性和选择进行了讨论。从实践中证实了当语音样点数N与LPC预测阶数P在短时分析中达到N(?)P时,使用s_w(n)及LPC正则方程的高效递推算法较使用s(n)时的算法在维吾尔语语音识别中达到很好的识别效果,提高识别率达3~4个百分点。识别系统实时性有很大的提高。  相似文献   

12.
为进一步提升手指静脉识别算法的识别率与识别速度,在图像处理阶段,提取出手指图像的感兴趣区域(region of Interest, ROI),减少手指周围区域的干扰。为提升识别率,在局部二值模式 (local binary patterns, LBP)的基础上,引入像素邻域之间的关系,增强LBP的识别性能;然后将信息熵与改进型LBP结合得到新的ELBP特征,最后采用主成分分析(principal component analysis,PCA)降维,以减少识别时间,去除冗余特征。通过对比欧氏距离与曼哈顿距离构建的分类器,与其他主流特征比较,验证算法的识别性能。在SDUMLA数据库与天津市智能实验室采集指静脉图像数据库上,保证了算法的识别速度前提下,分别取得了99.53%、99.84%的识别率,与其他识别算法相比识别率有明显的提高。  相似文献   

13.
语音识别中语音信号端点检测的准确度起着至关重要的作用,传统的频带方差算法在强背景噪声环境下性能下降。提出一种改进算法,在保证算法复杂度较低的条件下,大大提高了检测的准确度。仿真证明,该算法在低信噪比条件下也具有较强的鲁棒性。  相似文献   

14.
摘 要解决对野外环境中低信噪比的人车地震动信号进行分类时传统模式识别方法应用不便,以及识别率较低的问题,通过基于包络检波、变分模态分解(VMD)和改进的深度自编码器(DAE)的特征提取算法研究了针对该类信号的处理方法和特征提取方法。首先对目标的地震动信号进行希尔伯特变换,获取信号的平滑包络线,然后对包络线进行变分模态分解,并用相关系数对分解得到的IMF信号进行筛选,并将相关度较高的分量加权合成为高信噪比的中间信号,再对其使用改进的深度自编码器中进行特征提取。最后使用泛化性能好的随机森林算法对信号进行分类,从而实现对人车目标的识别和分类。结果表明:该算法对两类目标综合识别正确率较其他传统算法有较大提高。可见该算法针对该类目标有应用价值。  相似文献   

15.
噪声环境下语音识别方法研究   总被引:5,自引:0,他引:5  
研究了6种噪声背景下与说话人有关的弧立词语音识别方法。它们是:线性预测误差法,单边自相关线性预测法,语音前端声学处理法,正则相关分析的谱变换补偿方法,特征综合法和同模极点增加法。实验结果表明,这6种方法都有效地提高了噪声环境中语音识别率,其中较好的方法在强噪声环境中(信噪比为0dB)的语音识别率达到80%以上,为信噪比较低的噪声环境中自动语音识别展现了美好前景。  相似文献   

16.
汪兰兰  蔡昌新 《科学技术与工程》2022,22(26):11524-11532
针对目前常见的语音特征提取方法应用于真实环境中,所提取的语音特征包含有噪声干扰的问题,进而导致情感识别时出现的分类模糊化情况,为此提出一种新的语音特征提取方法,即线性预测基音频率特征提取方法。它主要是基于线性预测系数来构建模型,利用构建的模型消除声道响应信息以及抑制噪声干扰。由于此方法对于分类模糊化问题没有得到较好改善,利用模型相同的LPCMCC(LPC Mel cepstral coefficients,LPC美尔倒频谱系数)来对线性预测基音频率进行改进,并设计基于线性预测基音频率、其改进特征、LPCMCC与SVM(support vector machines,支持向量机)的语音情感识别对比实验。对比实验表明,此改进特征提取方法应用在情感识别领域的平均精度最高为84%,比线性预测基音频率和LPCMCC要高出22%、14%。为了测试此改进特征在真实环境中的分类效果,在此改进特征的基础上设计了一种基于MATLAB GUI技术的语音情感识别系统。实验结果表明这种新的改进特征能有效改善情感识别时出现的分类模糊化情况,基于此改进特征的语音情感系统能广泛地识别出噪声干扰下的说话人情感。  相似文献   

17.
一种改进的DTW语音识别系统   总被引:1,自引:0,他引:1  
苏昊  王民  李宝 《中国西部科技》2011,10(1):38-39,94
动态时间规整(Dynamic Time Warping,DTW)是语音识别的一种简单有效的方法,该算法基于动态规划的思想,解决了发音长短不一的模板匹配问题,是语音识别中出现较早、较为经典的一种算法。这里改进了传统的DTW算法,将其应用到实时语音识别系统中,并在计算机上进行了仿真。实验结果表明,改进后的算法,能有效提高孤立词的识别性能。  相似文献   

18.
在语音识别系统中,易混淆语音是导致系统识别率下降的重要原因。汉语音节是由声母和韵母组成的,在易混淆语音中,其韵母部分的混淆度很大。针对易混淆语音的韵母部分,通过改进特征提取的方法来提高易混韵母之间的区分度,提出了一种基于小波分解和线性预测(WLPC)的特征提取方法,并用局部保持映射(Locality Preserving Projections)算法对提取的特征进行了特征变换。实验结果显示,与传统的MFCC特征相比,该特征能更好的区分不同的韵母。  相似文献   

19.
针对说话人识别的噪声鲁棒性问题,在对数谱最小均方差误差估计算法基础上,采用改进的最小值控制递归平均算法对语音帧信噪比进行估计,通过对前一帧的短时功率谱进行2次平滑和前向多帧最小值搜索,结合语音存在概率估计出当前帧的信噪比,并根据信噪比自适应调整增益因子的大小,对噪声进行消除。构建了一种改进的LSA语音增强方法,使用该方法可以使增强后的语音保持较高的自然度。实验结果表明,与MMSE-LSA算法比较,改进的LSA算法具有更好的语音增强效果,在5dB各类噪声环境下,其平均信噪比较MMSE-LSA算法提高1.36dB,主观语音质量评估平均提高8%。将该方法用于说话人识别系统,其检测代价较采用MMSE-LSA算法的系统平均降低3%。  相似文献   

20.
结合动态谱特性的语音识别研究,阐述了一种有限状态矢量量化(FSVQ)方法。FSVQ利用了过去的信息来选择合适的码本进行了编码,对于语音识别更为有效。改进了所使用的语音特征参量,除了LPC倒谱系数外,结合使用了动态谱特征和能量的对数值,并根据汉语发音特征对语音信号端点进行一种加以权处理。实验结果表明:与说话人有关的孤立词识别率达到98%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号