首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 515 毫秒
1.
介绍了语音失真测度系统的构成以及实现的算法思想.采用前端处理技术.实现了对重放语音信号进行分帧、端点检测等特征的提取,获得了以Mel尺度倒谱参数作为衡量语音失真测度的特征向量.采用动态时间弯折算法,获得了用于语音质量客观评价的语音失真测度.  相似文献   

2.
一种改进的客观音质评价方法   总被引:4,自引:0,他引:4  
描述了利用人耳的听觉掩蔽效应来对巴克谱失真距离测度进行改进,并将这些测度应用在客观音质评价中,以提高主客观音质评价的相关度.改进的测度动态地确定语音信号每个巴克带的掩蔽门限,有选择性地计算失真距离,只包含听觉能够感知的失真.针对特定失真语音条件下的实验仿真结果表明,主客观评价结果之间具有更高的相关系数.可以推断这些测度作为对语音系统进行的客观音质评价,会具有好的有效性和实用性.  相似文献   

3.
针对传统谱估计增强算法易产生语音畸变、导致语音清晰度低的问题,提出了一种失真控制下的短时谱估计语音增强的新算法.该算法首先引入语音畸变的客观度量参数,并根据这一参数得到抑制语音畸变的约束条件,然后结合人耳听觉掩蔽特性和无语音概率参数,修正最小均方误差对数谱估计函数,最后联立约束条件和估计函数,得到增强后的语音,从而实现了在噪声抑制和语音畸变之间的折中,改善了语音增强的效果.主观试听和客观测试结果均表明,与其他谱减法相比,在相同的信噪比和去噪度条件下,新算法的语音畸变度最小且几乎察觉不到音乐噪声.  相似文献   

4.
对Itakura语音失真测度的改进   总被引:1,自引:0,他引:1  
提出了一种对Itakura语音失真测度的改进方法-感知谱失真(PSD)测度方法,该方法通过模拟人的听觉特性把语音短时谱转变为符合听觉特性的感知谱,再以感知谱为基础,结合Itakura测度的优点来度量语音失真程度。通过对不同质量的语音信号进行仿真实验以及与Itakura测度方法作对比实验,结果表明PSD测度克服了Itakura测度的不足,与语音质量的主观评价一致性较好,特别是在语音失真程度较大时PS  相似文献   

5.
分析了目前各种语音质量的客观评价方法,提出了一种改进的基于动态分帧技术并与MFCC(Mel Frequency Cepstral Coefficient)参数结合的谱失真参数MDCD(Mean Dynamic Mel-cepstrum Distance)来映射主观语音的MOS分.实验表明,采用新参数的主客观曲线拟合效果优于传统参数CD(Cepstrum Distance).文中最后用MDCD参数来重新评价某些信息隐藏算法的透明性.  相似文献   

6.
提出了一种对Itakura 语音失真测度的改进方法——感知谱失真(PSD) 测度方法,该方法通过模拟人的听觉特性把语音短时谱转变为符合听觉特性的感知谱,再以感知谱为基础,结合Itakura 测度的优点来度量语音失真程度.通过对不同质量的语音信号进行仿真实验以及与Itakura 测度方法作对比实验,结果表明PSD测度克服了Itakura 测度的不足,与语音质量的主观评价一致性较好,特别是在语音失真程度较大时PSD测度明显优于Itakura 测度.  相似文献   

7.
基于高斯混合模型(GMM)的语音帧谱包络转换算法容易导致转换后的语音谱包络过平滑、语音细节特征受损。通过对GMM中协方差的准确性与谱包络过平滑现象的研究,提出了一种基于预测谱偏移的自适应GMM建模方法。该方法采用平滑加权算法对目标谱的偏移进行建模,并根据语音帧信息自适应调节预测谱偏移项的比例系数,结合高斯混合模型共同实现对谱包络的转换。实验结果表明,该建模方法能够有效抑制转换后语音谱包络的失真现象,提高转换后语音的清晰度、自然度和可懂度。  相似文献   

8.
提出一种新的复杂环境噪声下无参考源语音质量客观评价方法.该方法基于准干净语音构造和有参考源评价模型,实现接近于有参考源客观评价的性能.首先,采用改进的最小值控制递归平均算法和多带谱减法获得带噪语音的准干净语音;然后,将该准干净语音作为改进的主观语音质量评估(PESQ)算法的参考语音,计算参考语音与带噪语音之间的失真误差,获得带噪语音的客观评价分值.实验结果表明:该算法客观评分相关度达到0.927,与有参考源语音质量客观评价标准的相关度0.931相比,实现了99%的接近,与无参考源的客观评价标准相比,提高了7.4%.  相似文献   

9.
一种基于混合MELP/CELP的4 kbit/s声码器   总被引:1,自引:0,他引:1  
利用混合激励线性预测 (mixed excitation linear prediction,MELP)算法和码激励线性预测(code excitation linear prediction,CELP)算法的优点,提出了一种混合MELP/CELP语音编码模型.编码端对强浊音帧采用MELP编码,对弱浊音帧和清音帧进行CELP编码.MELP编码器采用相位对齐技术提取强浊音帧的相位参数,解决了合成语音与原始语音在时间上不同步的问题.对实现的4 kbit/s混合MELP/CELP声码器进行客观MOS(mean opinion score)值和主观DRT(diagnostic rhythm test)清晰度测试,结果表明,该声码器的合成语音具有较高的可懂度和清晰度.  相似文献   

10.
为了提高通信系统的抗干扰和抗攻击能力,尽可能降低语音编码速率.提出了一种O.6 kb/s语音编码算法.算法基于3帧联合,对多帧联合参数采用高效矢量量化,在降低语音编码速率的条件下保证语音编码质量.其中,对线谱对参数采用预测多模式多级矢量量化码本结构.在码本设计过程中,提出了多模式渐进闭环设计,对各类码本联合优化,并联合优化预测器和量化器,可以有效提高线谱对参数量化质量.在译码方,采用多带混和谐波激励提高合成语音清晰度.测试结果表明,该语音编码算法合成语音PESQ(perceptualevaluation of speech quality)得分可以达到2.7,汉语诊断押韵测试DRT(diagnostic rhyme test)得分可以达到89.7.  相似文献   

11.
针对谱减法增强语音后残留"音乐噪声"明显,影响语音清晰度的问题,在分析现有的噪声谱减算法基本特性的基础上,提出一种基于噪声短时谱动态估计的语音降噪方法.通过估计噪声短时功率谱及其变化趋势,动态调整谱减法中的过减系数,有效抑制残留噪声.仿真实验表明,新的谱减算法在提高语音信噪比的同时保持较小的失真度,具有较好的增强效果.  相似文献   

12.
为了在保证语音增强算法性能的同时,降低算法复杂度,提出了一种巴克域最小统计量控制递归平均噪声估计算法.将带噪信号在巴克域进行分解并进行最小统计量分析,基于此最小统计量控制噪声的递归平均估计.算法基于听觉模型,充分利用巴克带内频带间的相关性,具有较好的噪声跟踪估计性能.该算法复杂度低,适用于常见语音增强方法.仿真结果表明,基于该噪声估计的语音增强可以有效地抑制噪声,增强后语音失真较小,在低信噪比条件下能够有效改善语音编码合成后的语音质量.  相似文献   

13.
调制域谱减法用于鲁棒性语音识别   总被引:2,自引:2,他引:0  
针对语音识别在实际环境中缺乏稳健性的问题,提出了将调制域谱减法应用于语音识别前端的方法。先将语音信号变换到调制域,在调制域用谱减法将信号增强,在减少语音畸变的基础上提高信噪比,然后再进行识别。仿真实验表明,调制域谱减法能在较大的信噪比区间内提高系统识别率,证明此方法能显著提高语音识别系统的抗噪声能力。  相似文献   

14.
在常规谱减法的理论基础上,针对其去噪中存在的问题,提出一种改进算法,对清音和浊音分别采用高频提升和频带加宽的处理方法,使在消除信号噪声的同时尽可能地保留信号中的弱特征成分.利用LSD和PMD公式从理论和实践两方面证明该方法在有效抑制背景噪声的同时还可以降低音乐噪声,获取最大的信噪比,减少语音失真,实现比常规谱减法更好的语音增强效果.  相似文献   

15.
为了提高主观和客观听力条件下语音可懂度的相关度,提出用耳蜗熵值来衡量语音的可懂度。利用提取的耳蜗熵值分段后的语音作为归一化协方差(normalized covariance measure,NCM)的语音可懂度算法的输入,分析高熵值语音段和低熵值语音段主客观相关系数的高低。结果表明,提取的高耳蜗熵值语音段比低熵值语音段对语音可懂度算法与主观评价的相关性高,高熵值语音段携带有更多的语音信息。  相似文献   

16.
联合波束形成与谱减法的麦克风阵列语音增强算法   总被引:1,自引:0,他引:1  
考虑到封闭环境的散射噪声场中,传统波束形成方法及单通道谱减法对噪声抑制的局限性,提出一种将波束形成方法与谱减法相结合的麦克风阵列语音增强方法.该方法首先通过波束形成器的空间滤波作用,将波达方向不同的语音信号和噪声信号加以区别,再经过延时补偿单元的相应处理,从而达到衰减噪声的目的,然后采用谱减法对波束形成器输出端的残留噪声进行后置处理.仿真实验结果表明。在小房间混响情况下,与其他方法相比,该方法不仅运算量小。而且具有良好的噪声抑制性能.  相似文献   

17.
为了提高在噪声环境下语音识别系统的性能,对基于子带独立感知理论的语音识别方法进行了研究.这些方法利用人耳对不同频率信号感知的差异,以及噪声和识别对象的频域特征差异,分别采用线性分析、判决分析、多层感知机以及子带最大似然估计对噪声影响进行补偿.实验表明,子带分析采用非线性策略优于线性策略.基于独立感知假定的子带模型,虽然由于独立性假定丢失了带间相关性,但对于噪声环境下语音识别而言可以捕获噪声和识别对象的频谱差异,从而获得比全带分析更高的鲁棒性.  相似文献   

18.
对基于矢量量化的频带扩展方法进行了改进.在码本形成上提出了重新量化的方法,并用码本结合浊音度的方法调整增益.首先根据清浊度和能量被划分为标准将窄带输入信号清音、浊音和静音3类;然后每类信号选择不同的码本,用基于矢量量化的方法将窄带信号的谱包络转换成高频带信号的谱包络;再用激励信号(高斯白噪声信号)和重建的高频谱包络合成高频带语音;最后将高频带与原窄带信号之和作为最终的宽带信号.仿真及与其他方法比较说明,本文的方法所需计算量小,适合实时环境.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号