共查询到20条相似文献,搜索用时 15 毫秒
1.
语音增强技术是语音信号处理的一个重要分支,也是语音识别系统的重要组成部分。简单介绍了现有的各种语音增强算法,并对目前应用最为普遍的谱相减法作了系统的描述。对传统型、增强型、改进型的谱相减法进行了探讨验证,提出了一种基于C语言环境的算法程序,详细地介绍了该程序并画出了它的算法流程图,而且进行了算法仿真,通过分析它在-5dB,0dB,5dB的信噪比下的输入输出波形,证明了该程序可以较好地实现语音增强。 相似文献
2.
基于语音编码系统的语音识别,由于受编码的影响其识别效果在编码速率下降时显著降低。传统的识别方法从重构语音波形中提取特征参数,并针对该特征参数进行训练和识别。比较了基于编码语音的识别准确率和基于编码参数的识别准确率,并研究了编码参数对识别准确率的影响。在此基础上,通过选择受编码影响较小的编码参数,直接将LPC参数和残差信号参数组合起来构成特征参数进行语音识别。实验结果表明,采用这种方法的AMR语音识别系统,其识别效果接近于基于原始语音的识别效果。 相似文献
3.
针对谱减法增强语音后残留"音乐噪声"明显,影响语音清晰度的问题,在分析现有的噪声谱减算法基本特性的基础上,提出一种基于噪声短时谱动态估计的语音降噪方法.通过估计噪声短时功率谱及其变化趋势,动态调整谱减法中的过减系数,有效抑制残留噪声.仿真实验表明,新的谱减算法在提高语音信噪比的同时保持较小的失真度,具有较好的增强效果. 相似文献
4.
主要研究用于分布式语音识别(DSR)的语音参数的提取方法以及参数性能分析。以前所用到的语音参数大部分是LPC倒谱参数,但其抗噪声性能较差。文中主要讨论了MEL倒谱参数,并在移动通信环境下,比较了两者的性能。 相似文献
5.
针对谱减法增强语音后残留音乐噪声明显,影响语音清晰度的问题,在分析现有的噪声谱减算法基本特性的基础上,提出一种基于噪声短时谱动态估计的语音降噪方法。通过估计噪声短时功率谱及其变化趋势,动态调整谱减法中的过减系数,有效抑制残留噪声。仿真实验表明,新的谱减算法在提高语音信噪比的同时保持较小的失真度,具有较好的增强效果。 相似文献
6.
为解决文本无关说话人识别中训练与识别环境不同导致模式失配的问题,提出了一种采用语音增强模块进行前端预处理的i-向量说话人识别系统,从而提高系统对于环境噪声的鲁棒性.为评估不同语音增强算法的性能,利用NIST08核心测试集进行仿真实验.采用IMCRA算法对语音进行噪声估计后,分别用维纳滤波法、MMSE-LSA、传统谱减法和多频带谱减法等4种方法进行语音增强前端处理,在基于i-向量的说话人识别系统下进行实验.实验结果表明采用了语音增强的系统具有一定抗噪声性能,并且在高信噪比条件下,基于多频带的谱减法在此系统下性能最佳,而低信噪比情况下MMSE-LSA算法更有优势. 相似文献
7.
随着语音处理技术研究的深入和实际应用的增多,各种语音处理系统面临着进一步提高性能的问题。语音增强技术广泛地用来提高语音处理系统前端预处理的抗噪声能力和输入信号的信噪比,改善语音质量、可懂度和系统的性能,而作为预处理或前端处理模块存在于语音处理系统中。因此,对语音增强技术的研究具有十分重要的意义。本文基于正交小波变换理论和谱减法对语音增强问题进行了研究。 相似文献
8.
随着小波变换理论的不断发展,小波变换去噪法不断丰富,小波阈值去噪法以算法简单、计算量小,吸引了众多研究者。通过对小波阈值去噪法传统阈值函数的研究,发现软硬阈值函数都存在着缺点;改进的半软阈值法综合了两者的优点,改正了两者的缺陷,明显改善了语音增强效果。并提出一种基于小波阈值去噪法与谱减法结合的改进算法,在较低信噪比下进行仿真,很好地抑制背景噪声和音乐噪声,减少语音信号的失真。 相似文献
9.
《南阳理工学院学报》2015,(6):56-60
Mel频率倒谱系数(MFCC)是语音特征提取的一种常用方法。因其能够充分模拟人耳的听觉系统,具有较高的识别精度,所以在语音识别中得到了广泛的应用。本文针对MFCC在语音识别中对中高频区域识别精度不高的固有缺陷,通过将MFCC、Mid MFCC、IMFCC与主成分分析(PCA)相结合,提出了一种在全频域实现精确且快速的识别方法,并进行了仿真实验验证。 相似文献
10.
基于FSS与PLP的噪声鲁棒语音识别 总被引:1,自引:0,他引:1
提出了一种基于分数阶谱相减(FSS)与感知线性预测(PLP)相结合的噪声鲁棒语音识别方法,记为FSS PLPC.该方法首先通过FSS在分数阶Fourier域对带噪语音进行降噪处理,然后计算增强语音的均方误差和Itakura距离并进行比较,以获得FSS的近似最优分数阶阶数.最后对根据此阶数得到的增强语音提取感知线性预测倒谱(PLPC).实验结果表明,FSS PLPC对于数字语音的识别性能优于传统的谱减法(SS PLPC)和感知线性预测倒谱(PLPC)法,并且随着信噪比的降低FSS PLPC表现出较好的噪声鲁棒性. 相似文献
11.
陈蕴谷 《安庆师范学院学报(自然科学版)》2010,16(1):19-21
本文提出了一种基于谱减法和经验模式分解的语音增强算法。在低信噪比的情况下用谱减法可以去除语音信号中的大部分背景噪声,再对已处理过的信号进行经验模式分解,对前几个IMF进行阈值处理可以进一步增强语音。实验表明:本算法去噪效果优于传统方法。 相似文献
12.
用于语音识别的基于高谱分辨率的谱减法 总被引:1,自引:0,他引:1
提出了一种新的基于高谱分辨率的谱减法,通常噪音帧和带噪语音帧具有相同的长度且都是短时帧,对短的噪音帧和带噪语音帧做傅立叶变换得到的谱分辨率低导致谱减法性能下降严重。基于平稳或接近于平稳的背景噪音下合并所有噪音帧再做傅立叶变换以提高噪音帧的谱分辨率;通过对带噪语音信号在时域进行前向和后向的延拓再做傅立叶变换以提高带噪语音信号的谱分辨率,在有效抑制噪音的同时减少了语音谱的失真并提高了系统识别率。 相似文献
13.
语音情感识别是人工智能领域的研究热点.对不同的特征参数提取直接影响了语音情感识别的效果.通过提取基频、共振峰和Mel频率倒谱系数三个能够充分反映语音情感的特征,采取支持向量机的方法对样本进行分类学习.实验结果表明这三种特征参数能够有效识别语音情感. 相似文献
14.
Mel 频率下基于 LPC 的语音信号深度特征提取算法 总被引:1,自引:0,他引:1
针对传统语音信号二次特征提取方法在保证识别率的前提下,实时性较差的问题,提出一种Mel频率下基于线性预测系数(linear predictive coefficient,LPC)的改进的语音信号深度特征提取算法.该方法根据人耳的听觉特性把LPC在Mel频率下进行非线性变换,再进行微分、高阶微分和按比例重组等步骤,得到一种既考虑声道激励又兼顾人耳听觉的新特征参数,从而大大减少传统语音信号深度特征提取的计算量,在不影响识别效率的情况下,极大提高系统的实时性.最后,将该算法在智能轮椅平台进行有效性验证,大量实验表明,语音控制系统实时性差的问题在使用该算法后能够得到明显改善,该算法既保证了特征提取识别率,也有效地改善了系统的实时性.在一定程度上使语音控制智能轮椅更具实用性. 相似文献
15.
16.
本文提出一种基于统计信息噪声估计的谱减语音增强算法,实验表明这种算法比起普通谱相减法算法能更显著地提高算法的客观性能,特别在非平稳噪声和低信噪比的环境中能快速估计出变化的噪声功率谱。 相似文献
17.
语音增强的目的是从带噪语音中提取尽可能纯净的原始语音.目前语音增强的方法很多,但由于噪声产生是随机的,而且产生的原因和特性相当复杂,因此在实际应用过程中要根据需求选用适当的语音增强技术才能达到较为理想的降噪效果.本文对不同噪声环境下的语音信号采用三种常用的语音增强技术进行降噪,并采用不同语音端点检测方法进行仿真实验来衡量降噪效果. 相似文献
18.
邓克岩 《西北民族学院学报》2007,28(4):18-21
实际环境中,语音总会受到外界噪声不同程度的干扰和影响.文章采用TMS320VC5416 DSP和TLV320AIC23 Codec组成实时系统,实时实现了基于卡尔曼滤波的谱减法的实时语音增强系统,能够实时、有效地提高语音信噪比,增强语音可懂度,改善语音质量. 相似文献
19.
微震监测是保证矿山安全生产的有效手段,微震信号识别精度直接影响着微震事件的判定及分析结果.鉴于此,以夏甸金矿微震监测数据作为样本,建立了基于Mel频谱和长短时记忆(long short-term memory, LSTM)神经网络与深度卷积神经网络(deep convolutional neural networks, DCNN)混合的矿山微震信号识别模型.首先对监测信号进行预处理,利用Mel时频谱降低干扰频段的权重并减小样本尺寸.然后利用LSTM和DCNN模型分别提取信号的时间特征及空间特征.通过多种模型的对比分析,结果表明本文提出的Mel-LSTM-DCNN混合模型对微震信号识别准确率最高.该模型为矿山准确识别微震信号提供参考. 相似文献
20.
针对现有单通道语音增强算法及传统波束形成算法的局限性,提出了一种基于双元麦克风线性阵的语音增强方法. 首先利用离线设计好的优化权值对输入信号进行加权求和以实现波束形成,然后结合一种新的噪声幅度谱估计方法,采用改进的幅度谱减法进一步增强语音信号. 仿真实验表明该方法简单易行并取得了较好的语音增强效果. 相似文献