首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 640 毫秒
1.
采用基于子空间的方法,对语音信号进行增强处理,该算法提供了在语音信号失真和残留噪声之间进行控制的机制。克服了以往语音增强算法中对语音信号的噪声特点的限制,可以对混有加性白噪声、有色噪声和音乐噪声的语音信号进行增强处理。  相似文献   

2.
针对噪声和混响情况下的语音增强问题,本文给出一种基于子带独立分量分析(ICA-R)算法和收缩函数后处理的语音增强方法.该方法将ICA-R和收缩函数算法相结合,在噪声和混响环境中通过对两路带噪语音信号进行增强处理,以实现增强目标语音信号的目的.首先对两路带噪语音信号进行子带分解;然后在子带内利用ICA-R算法从带噪语音信号中提取出子带目标信号,再经过综合滤波器形成全带目标信号;最后,将该信号经收缩函数后处理,得到增强后的目标语音信号.用实际录制的带噪语音信号对本文方法进行了测试,实验结果表明,该方法具有较强的噪声抑制能力,对语音信号造成的损伤较小.  相似文献   

3.
针对现有语音增强算法噪声残留和语音失真,不能同时达到最小这一问题,提出了一种改进的信号子空间结合维纳滤波法,进行两级语音增强。第一级利用听觉掩蔽参数改进信号子空间的增益矩阵,经处理后,可以有效降低语音失真度,并初步提高信噪比。然后利用维纳滤波算法对增强后的语音信号进行加强。实验结果表明,相比传统的信号子空间算法、维纳滤波算法,可以有效地减少语音信号中的残留噪声、降低语音信号的失真度、提升语音信号的整体质量。  相似文献   

4.
考虑到传统单通道语音增强算法对噪声抑制的局限性,本文采用由两个微型麦克风阵列组成的双微阵列,利用该阵列空间结构的时空域特性对含噪语音进行处理,提出了一种适用于双微阵列的语音增强算法。该增强算法是将各通道采集到的带噪语音信号先使用对数最小均方误差(Logarithmic Minimunm Mean Square Error,LogMMSE)提升其信噪比,然后利用频域宽带最小方差无畸变响应(MVDR)通过对目标声源信号的获取,保留目标声源方向的信号并抑制其他方向的信号干扰,最后通过一个改进可懂度结合改进最小控制递归平均(Improved Minimum Controlled Recursive Average Algorithm,IMCRA)噪声估计的维纳滤波器来去除噪声残留提升语音质量。仿真实验结果表明,相比传统的单通道语音增强算法,该算法具有良好的噪声抑制性能。  相似文献   

5.
基于CASA简化模型的语音增强算法   总被引:2,自引:0,他引:2  
基于听觉现象分析(CASA)模型的基本原理,针对仅有非语音信号干扰情况下的单通道语音增强处理问题,利用人耳的频率掩蔽效应,提出了一种单通道简化CASA计算模型语音增强新算法,新算法通过提取混合语音输入中的有效语音时频成分并利用人耳的听觉掩蔽效应重构合成增强语音输出信号,通过在汽车噪声和白噪声干扰下的仿真实验结果表明,简化的CASA模型语音增强算法的输出信噪比约提高了10dB,且可以有效抑制干扰噪声的听觉影响,增强输出语音信号的可懂度。  相似文献   

6.
考虑到传统单通道语音增强算法对噪声抑制的局限性,采用由两个微型麦克风阵列组成的双微阵列;利用该阵列空间结构的时空域特性对含噪语音进行处理,提出了一种适用于双微阵列的语音增强算法;该增强算法是将各通道采集到的带噪语音信号先使用对数最小均方误差(logarithmic minimum mean square error,Log MMSE)提升其信噪比;然后利用频域宽带最小方差无畸变响应(MVDR)通过对目标声源信号的获取,保留目标声源方向的信号并抑制其他方向的信号干扰;最后通过一个改进可懂度结合改进最小控制递归平均(improved minimum controlled recursive average algorithm,IMCRA)噪声估计的维纳滤波器来去除噪声残留提升语音质量。仿真实验结果表明,相比传统的单通道语音增强算法,该算法具有良好的噪声抑制性能。  相似文献   

7.
单通道语音增强中,已有的先验信噪比算法能有效地去除噪声,提升语音增强算法性能;但是由于在噪声功率谱估计不准确,造成噪声功率出现过估和低估的情况,造成了语音失真和保留较多残留噪声。通过倒谱处理能在含噪语音段中抑制语音中的谐频成分和在纯噪声段中避免部分较强的噪声成分误判为语音信号,准确地估计出噪声功率谱,同时语音失真不大。在多种噪声背景下的客观评价指标分析表明,经过倒谱处理后的先验信噪比估计算法能提高先验信噪比算法的估计性能。  相似文献   

8.
为提高语音增强算法消除方向性噪声和抑制混响的能力,结合单、多通道处理信号的优势,提出了双通道神经网络时频掩蔽语音增强算法.首先,利用改进的多分辨率耳蜗动静态特征,结合依据信噪比优化的自适应掩模,对双麦克风信号分别进行单通道神经网络初步语音增强,达到全面利用语音非线性特征改善感知度的目的;其次,提出一种基于自适应掩模方向...  相似文献   

9.
语音在传输过程中受到来自周围环境、传输媒介等的干扰是不可避免的,这些干扰会严重影响语音接收时的质量,导致收到的语音信号不再是原始的纯净语音信号,而是带有各种干扰噪声的语音信号,这不仅影响语音的收听质量,也给后续的语音处理带来了一定的影响.因此对语音进行增强不可或缺.大部分传统的语音增强算法仅仅只通过改变语音的幅度,再叠加上原始的语音相位或者仅调整语音的相位再和未改变的幅度叠加来实现语音信号重建从而增强语音.本文提出了一个通过既改变语音信号的幅度又改变其相位的语音增强算法.通过使用客观语音质量测评(PESQ)和语谱图对用不同方法增强后的语音进行比较,验证了用本文方法得到的增强语音质量更佳.  相似文献   

10.
针对语音信号特征提取在处理含噪语音信号时识别率低,抗干扰性差等问题,提出了一种基于改进的经验模态分解算法对含噪语音信号进行特征提取.该方法通过对含噪声语音信号分解分类并对两类模态分量分别处理再进行重构和特征提取,解决了目前大多数语音信号特征提取过程会滤掉部分原信号问题,在有效地消除了噪声信号的基础上,尽可能多地保存原信...  相似文献   

11.
基于HTK的普米语孤立词的识别,通过对特定发音人和非特定发音人的语音进行特征分析、预处理、提取MFCC特征参数,从而建立每个普米词的HMM模型,最后采用Viterbi算法进行模型的训练和匹配.实验表明:对特定发音人和非特定发音人,随着普米词个数的增加,识别率虽有所下降,但是变化很小,识别率均超过了95.00%,识别效果很好.语料的信噪比和发音人的发音稳定性是导致识别率下降的重要原因.  相似文献   

12.
为了帮助发音困难者障碍者和外语学习者矫正普通话发音错误,提出基于Mel频率倒谱系数(Mel frequencycepstrum coefficient,MFCC)特征比较和模拟退火-遗传算法(simulated annealing genetic algorithm,SAGA)的普通话音素评分模型。该模型采用动态时间弯折(dynamic timewarping,DTW)算法对普通话音素进行相似度比对,并基于SAGA评分机制对发音进行自动评分。本文对比了不同优化算法(SAGA和局部优化算法)、不同DTW算法对语音评分的影响。结果发现:SAGA评分模型下的音素评分正确率大于94%,远远优于局部优化算法。此外,在SAGA评分模型下,搜索路径为平行四边形的改进DTW算法具有最优的评分结果。因此,基于MFCC和SAGA的评分模型适用于普通话音素评分。  相似文献   

13.
基于标准语音的识别系统在识别带有发音变异的口语语料时,识别率较低。针对这一问题,提出了一种在标准维吾尔语发音字典的基础上生成多发音字典的方法。采用基于专家经验和数据驱动相结合的方法分析了维吾尔语方言口音发音变异规则,构造发音变异集合,生成初始的多发音字典,并运用了自动数据处理算法和门限阈值法,使得能够从方言口音训练语音数据中自动获得精简的多发音字典。实验结果表明:该方法对维吾尔语方言口音的识别性能有提升作用。  相似文献   

14.
藏语特征提取算法是藏语语音识别系统中最为关键的一个环节。文章在分析藏语发音特点的基础上,建立了基于模拟人耳听觉系统的Mel倒谱系数(MFCC)特征提取算法,然后通过LDA信息压缩算法,对提取的特征数据进行压缩,在降低维数的同时提高了识别率和运算效率,总结出了符合藏语语音特点的LDA-MFCC特征提取算法。  相似文献   

15.
基于音素的发音质量评价算法   总被引:6,自引:0,他引:6  
面对广大的外语学习者,计算机辅助语言学习系统已经成为一种最佳的口语学习方式。该文提出了一种新的应用于计算机辅助语言学习系统的面向英语学习人群的发音质量评价算法,名为PASS(phone-basedautomaticscoreforl2speechquality)。PASS算法以基于隐含Markov模型的语音识别和口音自适应技术为基础,考察了音素发音的准确性和流利性信息,定义了音素级的发音质量分数,从而可以综合得到整句的评分结果。在实验室自行采集和精细标注的非母语语音库上与其他评分算法进行比较实验,PASS与专家评分的句子级相关性达到了0.66,优于其他算法。目前PASS算法已经被成功地应用于清华大学出版社的互动式语言学习系统中。  相似文献   

16.
通过汉语普通话单音节清晰度听觉混淆实验考察混响所带来的混叠效应对普通话声母听感相似度的影响,并进一步比较在混响和噪声这两种不同的声学传递条件下声母听觉混淆情况间的差异,结果发现二者之间存在明显的差别。混叠效应下声母听感相似度的绝对量值明显高于噪声掩蔽下的值。且在混叠效应下声母的聚类关系大体上是按照发音部位形成的,而噪声掩蔽条件下的聚类关系大体上是按照发音方式形成的。这对思考构建合理的声母区别特征体系有启发意义。  相似文献   

17.
一种改进的DTW语音识别系统   总被引:1,自引:0,他引:1  
苏昊  王民  李宝 《中国西部科技》2011,10(1):38-39,94
动态时间规整(Dynamic Time Warping,DTW)是语音识别的一种简单有效的方法,该算法基于动态规划的思想,解决了发音长短不一的模板匹配问题,是语音识别中出现较早、较为经典的一种算法。这里改进了传统的DTW算法,将其应用到实时语音识别系统中,并在计算机上进行了仿真。实验结果表明,改进后的算法,能有效提高孤立词的识别性能。  相似文献   

18.
利用语音识别技术,依英语发音的特有性,搭建完整合理的计算机辅助英语发音评测系统。整个系统包括3个部分:语音段验证、语音信号切割和发音评测。其中语音段验证利用置信度评估的技术,并依据置信度阀值对评测语音内容是否需要评测做出判断;语音信号切割是以预先训练好的英语发音声学模型为切割依据,通过强制对位的方式切割出正确的发音区段;英语发音评测是系统的核心,使用的评测方式是比较评测语音和标准语音的相似度,采用4个评测特征:发音完整度、韵律性、语速和准确度进行发音相似度评测。针对不同的特征参数设计合理的评测机制,并对4个特征参数进行加权运算,以建立一个完整合理的英语发音评测系统。实验证明,系统能够给出比较客观的评分,达到预期设计目标。  相似文献   

19.
去噪算法在图像处理中占有极其重要的地位。为了对含有高斯白噪声和脉冲噪声的图像进行去噪,在小波软阈值去噪算法的基础上,提出一种基于噪声个数判断的改进型中值滤波算法。仿真结果表明,该算法能够同时抑制高斯白噪声和脉冲噪声,可以更好地保留图像的边缘细节,与小波软阈值算法、小波硬阈值算法、中值滤波算法相比,具有更好的去噪性能。  相似文献   

20.
中值滤波是广泛应用于去除脉冲噪声的一种非线性去噪方法,但是单一地使用中值滤波方法去除脉冲噪声会造成图像细节信息的丢失,从而使图像变得模糊.基于噪声点检测的脉冲噪声滤波方法可以在滤除噪声的同时有效地保持图像的细节信息.本文在此基础上提出了一种改进的基于噪声点检测的脉冲噪声滤波算法,该算法在检测噪声点时用被检测点的中值滤波结果作为判定该点是否为噪声点的依据.而在滤除噪声时,采用的是迭代的中值滤波算法.从实验结果中可以看到。与其它中值滤波算法相比。本文的算法在去除脉冲噪声时能取得理想的去噪效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号