首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
端点检测是语音标注的重要前序技术,针对语音标注,设计了一种基于信噪比分类的自适应端点检测算法.该算法首先对标注语音的信噪比分布范围进行分析,将信噪比分类,在每类信噪比范围内选择对应较优的算法.在高信噪比范围选择子带谱熵法,在中等信噪比范围内选择均匀子带频带方差法,而在低信噪比环境下先对带噪语音进行谱减法去噪处理,再采用...  相似文献   

2.
基于浊音语音谐波谱子带加权重建的抗噪声说话人识别   总被引:1,自引:0,他引:1  
提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率.  相似文献   

3.
传统的端点检测在信噪比较高的环境下可以有效地对语音进行端点检测,但是在低信噪比环境下端点检测的正确率急剧下降。针对在低信噪比环境下语音端点检测正确率不高的问题,提出一种将调制域谱减法和对数能量子带谱熵相结合的的端点检测算法;该算法首先利用调制域谱减法去除带噪语音的噪声以提高语音信号的信噪比,然后结合对数能量和子带谱熵算法对消噪后的语音信号进行端点检测。实验仿真结果表明,该算法在低信噪比环境下能有效提高语音端点检测的正确率且具有一定的稳健性。  相似文献   

4.
传统的端点检测在信噪比较高的环境下可以有效的对语音进行端点检测,但是在低信噪比环境下端点检测的正确率急剧下降。针对在低信噪比环境下语音端点检测正确率不高的问题,提出一种将调制域谱减法和对数能量子带谱熵相结合的的端点检测算法。该算法首先利用调制域谱减法去除带噪语音的噪声以提高语音信号的信噪比,然后结合对数能量和子带谱熵算法对消噪后的语音信号进行端点检测。实验仿真结果表明,该算法在低信噪比环境下能有效提高语音端点检测的正确率且具有一定的稳健性。  相似文献   

5.
端点检测是语音信号处理的过程中非常重要的一个环节,其准确性直接影响语音信号处理的速度和结果.特别是在实际应用中因信噪比较低,使得某些高信噪比下性能好的端点检测算法准确率也比较低.为了提高在低信噪比的环境下佤语语音端点检测的准确率,本文使用了一种基于多窗谱估计谱减法和能熵比法的语音端点检测复合算法.该算法首先利用多窗谱估计谱减法去除语音的背景噪音以提高信噪比;其次再对去噪后的语音使用能熵比算法进行端点检测;最后借助Matlab工具对佤语语音进行仿真实验.仿真结果表明:对于低信噪比的环境下的佤语语音,本文使用的基于多窗谱估计谱减法和能熵比法复合算法同常规能熵比算法相比,端点检测的准确率提高了34%.  相似文献   

6.
语音端点检测是语音处理分析过程中的一个重要组成部分,针对方差法在低信噪比下对语音信号端点检测准确率低的问题,本文提出一种子带频带方差法和谱减法相结合的检测算法,算法中采用多窗谱估计改进谱减法对河南方言语音进行降噪处理,并将得到的信号的子带频带方差进行端点检测.用Matlab进行仿真验证了此方法在端点检测中的准确性,该方法降低了河南方言语音处理的时间,为进一步提取河南方言语音识别特征参数提供了条件.  相似文献   

7.
针对基本谱减法的噪声残留以及损伤语音的可懂度和自然度等问题,在基本谱减法原理基础上,提出了基于参数自适应的改进谱减法。引进谱减功率系数和谱减噪声系数,以增强后语音信号的信噪比为输出,以变化的谱减功率系数和谱减噪声系数为输入,自动控制选择最优参数,并且将其与带噪语音输入信噪比相匹配。对信号进行语音增强时,通过计算其输入信噪比,利用最优参数曲线得到最优参数值,然后结合平滑处理的过程实现语音增强最大化。实验表明,本文算法有效提高了基本谱减法的语音增强性能。  相似文献   

8.
一种基于功率因数补偿的谱相减算法改进   总被引:1,自引:0,他引:1  
对带噪语音进行传统谱减增强后,会引入"音乐噪声",并造成语售可懂度急剧下降.针对这一缺点,本文提出了一种采用功率因数补偿的过减形式的谱相减算法,以提高语音可懂度.采用MATLAB对算法进行了仿真,仿真结果表明:该算法有效的抑制了背景噪声、减少了"音乐噪声",比传统谱相减算法有较大优越性.  相似文献   

9.
在鲁棒主成分分析中引入非负矩阵分解学习得到非负语音字典,提出了一种非负字典训练和鲁棒主成分分析相结合的非监督单通道语音增强算法.算法采用交替方向乘子计算优化解.采用客观感知语音质量评估方法(PESQ)对增强效果进行评估.评估中采用了TIMIT标准语音和20多种噪声在不同信噪比下进行混合得到的带噪语音信号.评估结果表明:本文提出的方法优于典型的非负矩阵分解方法和鲁棒主成分方法.  相似文献   

10.
针对低信噪比下语音增强困难的问题及经验模态分解(empirical mode decomposition,EMD)在语音增强中的有效应用,提出了一种基于EMD的前后置滤波语音增强算法.将含噪语音信号进行卡尔曼滤波后做EMD分解,采用能量阈值法判断出含有残余噪声的本征模态函数(IMF),对其小波变换后与其余IMF重构为最终的语音增强信号.实验表明,在输入信噪比为-10~5dB的不同噪声环境下,以时域分段信噪比及语音质量感知评测PESQ作为评价指标,效果均优于单独的EMD、小波软阈值法及卡尔曼滤波算法,是一种有效的语音增强算法.  相似文献   

11.
近几十年来,语音识别系统已由实验室环境走向真实的世界中。在不同的环境噪声下,识别性能却仍不尽人意,尤其是在低信噪比的环境中。为解决在低信噪比情况下的低识别率的问题,以声学参数MFCC(Mel-frequency cepstrum coefficient)为基础,提出了一种基于统计阈值的倒谱均值方差归一化算法,该算法能进一步减小训练环境和测试环境的不匹配程度,从而提升了语音识别系统对环境噪声的鲁棒性。首先,对输入的语音提取MFCC声学参数,然后对提取的声学参数作均值方差归一化处理,最后采用统计阈值的方法抑制归一化后存在变异的特征。该算法能增加带噪语音特征和纯净语音特征的相似性;与MFCC为基线的系统相比,在低信噪比情况下,该算法的错误率最高下降约40%,同时该方法也优于其他的鲁棒性特征倒谱均值减和倒谱均值归一。  相似文献   

12.
针对噪声环境下语音识别系统性能下降的问题,提出一种基于语音时频相关性的Mel特征矢量聚类补偿算法。该算法首先实现掩码估计,利用纯净语音信号时域和频域的相关性,实现了时频块的有效划分和基于时频块的语音特征聚类。在此基础上,对带噪语音的Mel语谱进行特征补偿。采用HTK工具和TIDIGITS数据库加入不同类别噪声的语音测试结果表明:该算法在不同信噪比条件下,获得了较基于频域相关性聚类特征补偿算法更好的性能。  相似文献   

13.
低信噪比下基于谱熵的语音端点检测算法   总被引:14,自引:0,他引:14  
为提高语音端点检测系统在低信噪(0 dB以下)下检测的准确率,提出了一种基于谱熵的端点检测算法。将每帧信号分为16个子带,选取频谱分布在250~3.5 kH z并且能量不超过该帧总能量90%的子带,计算经过语音增强后的子带能量以及各子带信噪比,根据各子带信噪比的不同调整其在整个谱熵计算过程中的权重,然后平滑谱熵,以最终的谱熵作为端点检测的依据。实验结果表明,此方法在较低的信噪比下能够显著地提高端点检测的准确率。对坦克噪声,检测效果明显优于G.729中的端点检测算法,即使在-5 dB的信噪比下,仍然可以达到95%以上的检测率。  相似文献   

14.
为解决文本无关说话人识别中训练与识别环境不同导致模式失配的问题,提出了一种采用语音增强模块进行前端预处理的i-向量说话人识别系统,从而提高系统对于环境噪声的鲁棒性.为评估不同语音增强算法的性能,利用NIST08核心测试集进行仿真实验.采用IMCRA算法对语音进行噪声估计后,分别用维纳滤波法、MMSE-LSA、传统谱减法和多频带谱减法等4种方法进行语音增强前端处理,在基于i-向量的说话人识别系统下进行实验.实验结果表明采用了语音增强的系统具有一定抗噪声性能,并且在高信噪比条件下,基于多频带的谱减法在此系统下性能最佳,而低信噪比情况下MMSE-LSA算法更有优势.  相似文献   

15.
语音增强的目标是从含有噪声的语音信号中提取尽可能纯净的原始语音.在实际应用中,需要对背景噪声进行预估计,以达到改善语音质量.目前常用的语音增强方式是谱减法,但由于该算法在低信噪比环境下的效果较差,所以限制了其应用范围.该文将实时噪声估计同谱减法相结合,针对谱减法在低信噪比下效果不明显的缺点,给出一种新的语音增强方案.该方案的目的是优化传统谱减法的性能,对噪声进行更为准确的实时估计;该方案的特点就是利用谱熵对噪声进行估计,通过谱熵估计每一帧语音的噪声,再利用谱减法达到降噪的目的.实验结果表明,该方法与传统的谱减法相比,在低信噪比环境下均能得到较好的去噪效果.  相似文献   

16.
针对谱减法增强语音后残留"音乐噪声"明显,影响语音清晰度的问题,在分析现有的噪声谱减算法基本特性的基础上,提出一种基于噪声短时谱动态估计的语音降噪方法.通过估计噪声短时功率谱及其变化趋势,动态调整谱减法中的过减系数,有效抑制残留噪声.仿真实验表明,新的谱减算法在提高语音信噪比的同时保持较小的失真度,具有较好的增强效果.  相似文献   

17.
提出一种新的复杂环境噪声下无参考源语音质量客观评价方法.该方法基于准干净语音构造和有参考源评价模型,实现接近于有参考源客观评价的性能.首先,采用改进的最小值控制递归平均算法和多带谱减法获得带噪语音的准干净语音;然后,将该准干净语音作为改进的主观语音质量评估(PESQ)算法的参考语音,计算参考语音与带噪语音之间的失真误差,获得带噪语音的客观评价分值.实验结果表明:该算法客观评分相关度达到0.927,与有参考源语音质量客观评价标准的相关度0.931相比,实现了99%的接近,与无参考源的客观评价标准相比,提高了7.4%.  相似文献   

18.
由于噪声信号的干扰,导致机器人难以实现对微弱信号的远距离语音识别,影响最终的识别效果.为此,本文提出基于微信号增强的机器人远距离语音识别仿真研究.首先采用谱减法对微信号进行增强处理,由于语音信号中噪声功率谱具有一定的稳态属性,可估算出噪声的功率谱,再利用谱减计算求出纯净语音的功率谱,对傅里叶变换后的各个相位信号进行差异化赋权后,再对去噪功率谱进行拟合,完成对信号相位的恢复.在语音识别阶段,将增强后的原始语音信号分解为若干个独立的语音帧,在梅尔三角滤波器组中提取语音信号的Mel频谱参数,将其与语音频率之间的关系作为识别特征参数,最后利用梯度下降算法,在损失函数的约束下匹配与识别特征拟合度最高的内容,实现语音识别.仿真测试结果表明,本文提出的设计方法在噪声、不同信噪比、不同测试距离下对语音的识别率均达到了95.00%以上,与对照组相比具有更好的识别效果.  相似文献   

19.
动态时间规整(dynamic time warping,DTW)是一种相对简单成熟的算法,广泛用于语音识别系统中.针对环境噪声对声纹识别系统性能的影响,用信噪比关联谱减及自适应门限端点检测进行抗噪声处理,在此基础上采用DTW算法设计了基于嵌入式ARM9平台的声纹识别实现方案,并给出了带噪环境下的声纹识别实验结果.  相似文献   

20.
低信噪比环境下语音信号的端点检测在语音识别与通信等领域具有重要意义,目前低信噪比环境下的端点检测还存在效率低、识别率不高等问题.本文在分析梅尔频率倒谱系数(MFCC)和短时能量在端点检测中应用的基础上,提出将MFCC前三维度分量相加(MFCC_a),再与短时能量相除(梅尔能量比)作为语音特征参数的语音端点检测测度,最后利用模糊C均值聚类算法自适应确定双门限阈值进行端点检测.选取TIMIT语音库中的50条语音信号进行实验,结果表明:在信噪比为5 dB、0 dB、-5 dB的噪声环境下,与能零比、谱熵等算法相比,本算法端点识别准确率均有所提高,其中在-5 dB信噪比环境下提升了约30%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号