首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 171 毫秒
1.
为了能方便、快捷、可靠地对失真语音进行语音清晰度性能评价,提出了一种基于语音分类的加权巴克谱失真语音清晰度客观评价算法SC-WBSD.该算法提出在巴克域中对清音帧、浊音帧及过渡音帧巴克带谱失真进行加权来求失真语音的客观失真测度.通过分析 3类语音的巴克谱失真测度与DRT分的相关程度,提出一组以相关系数的幂次方为权重的有效SC-WBSD权重矢量.实验结果表明,SC-WBSD方法和DRT分的相关度达到了0.924 73,与巴克谱失真测度算法相比提高了4%.  相似文献   

2.
利用径向基函数网络(RBFN)进行语音质量客观评价, 以避免在回归分析中选取具体函数的困难. 选取3种距离测度而非语音文件本身作为神经网络的输入, 使得网络输入维数大大减小,网络结构大大简化. 且对径向基函数网络结构作了修正, 使其更便于作音质评价. 作者在网络参数和结构学习中采用平滑后的训练集, 有效减少了随机因素对客观评测结果的影响, 也大大减少了网络结构的复杂性. 主客观评价结果的相关性实验中, 相关系数达0.96以上, 这表明了该方法的可靠性.  相似文献   

3.
介绍了语音失真测度系统的构成以及实现的算法思想.采用前端处理技术.实现了对重放语音信号进行分帧、端点检测等特征的提取,获得了以Mel尺度倒谱参数作为衡量语音失真测度的特征向量.采用动态时间弯折算法,获得了用于语音质量客观评价的语音失真测度.  相似文献   

4.
提出了一种对Itakura 语音失真测度的改进方法——感知谱失真(PSD) 测度方法,该方法通过模拟人的听觉特性把语音短时谱转变为符合听觉特性的感知谱,再以感知谱为基础,结合Itakura 测度的优点来度量语音失真程度.通过对不同质量的语音信号进行仿真实验以及与Itakura 测度方法作对比实验,结果表明PSD测度克服了Itakura 测度的不足,与语音质量的主观评价一致性较好,特别是在语音失真程度较大时PSD测度明显优于Itakura 测度.  相似文献   

5.
对Itakura语音失真测度的改进   总被引:1,自引:0,他引:1  
提出了一种对Itakura语音失真测度的改进方法-感知谱失真(PSD)测度方法,该方法通过模拟人的听觉特性把语音短时谱转变为符合听觉特性的感知谱,再以感知谱为基础,结合Itakura测度的优点来度量语音失真程度。通过对不同质量的语音信号进行仿真实验以及与Itakura测度方法作对比实验,结果表明PSD测度克服了Itakura测度的不足,与语音质量的主观评价一致性较好,特别是在语音失真程度较大时PS  相似文献   

6.
为提高语音干扰效果客观评估的效率,以平均单点能量比为客观评估测度,以误组率为主观评价测度,以最小二乘法为主客观拟合方法,提出一种新的方法。使用Matlab对标准语音文件叠加高斯白噪声,模拟受噪声干扰的语音文件,该方法的主客观拟合程度达到89.5%。使用通信干扰设备测试数据进行验证,正确率达到86%,计算时间不超过10s,证明对于噪声干扰,该算法效率较高。  相似文献   

7.
分析了目前各种语音质量的客观评价方法,提出了一种改进的基于动态分帧技术并与MFCC(Mel Frequency Cepstral Coefficient)参数结合的谱失真参数MDCD(Mean Dynamic Mel-cepstrum Distance)来映射主观语音的MOS分.实验表明,采用新参数的主客观曲线拟合效果优于传统参数CD(Cepstrum Distance).文中最后用MDCD参数来重新评价某些信息隐藏算法的透明性.  相似文献   

8.
主要讨论了一种使用语音频谱动态特性的倒谱距离测量对通信系统或通信设备进行客观音质评价方法,它是在使用LPC倒谱距离评价普通话语音质量的基础上发展起来的,语音频谱动态特性是利用倒谱对时间的回归分析来表示的,这种度量方法中,使用倒谱系数,倒谱回归系数和能量回归系数3个参数的距离测量,在使用了谱包络信息的基础上,考虑了谱包络随时间的变化量及信号能量随时间的变化,比较了4种距离估算方法和主观音质评价(MO  相似文献   

9.
非均匀量化器广泛运用在感知音频编码器中.通过对非均匀量化器失真的研究,引入了量化器的群能量失真概念.该概念定义为量化前的原始信号能量和量化后的重建信号能量的误差期望值.根据此概念提出了零群能量失真量化器,这种量化器能使原始信号能量和重建信号能量保持守恒.在量化器的量化电平间使用零群能量失真原则,约束量化电平间的群能量失真,可以获得与原始量化谱分布相关的动态量化区间划分.通过对原始量化谱的分布进行频数统计,近似计算动态量化区间划分,修改量化器的取整方式,使用该近似的动态量化区间划分,实现了随输入信号分布变化的动态调整量化器.客观音质评价实验显示,使用动态调整量化器先进音频编码,与使用标准推荐的量化器相比,在相同比特率下,客观音质评价指标失真指数和噪声掩模比都有所提高,编码器音质得到改进,且音质改进程度随着比特率的增加而增大.而基于对比听音实验的主观音质退化程度比较表明,使用动态调整量化器的先进音频编码,与标准算法相比,在相同码率下有更高的音质还原度 在维持标准算法音质水平的前提下,可节省一定比特率.该动态调整量化器不改变音频编码器自身结构,在不显著增加的计算量和存储量的条件下,提高了编码器性能,且适用于多种类型音频编码器.  相似文献   

10.
提出一种新的复杂环境噪声下无参考源语音质量客观评价方法.该方法基于准干净语音构造和有参考源评价模型,实现接近于有参考源客观评价的性能.首先,采用改进的最小值控制递归平均算法和多带谱减法获得带噪语音的准干净语音;然后,将该准干净语音作为改进的主观语音质量评估(PESQ)算法的参考语音,计算参考语音与带噪语音之间的失真误差,获得带噪语音的客观评价分值.实验结果表明:该算法客观评分相关度达到0.927,与有参考源语音质量客观评价标准的相关度0.931相比,实现了99%的接近,与无参考源的客观评价标准相比,提高了7.4%.  相似文献   

11.
提出了一种高效心理声学模型语音质量评价(EPM-SQE)算法.该算法采用12阶美尔倒谱参数(MFCC)作为语音信号特征向量,其空间复杂度小于巴克谱.对MFCC进行相对谱(RASTA)滤波,可以突出快变信号对听觉感知的影响.将滤波后的参数映射为响度,由此模拟人的感知过程.计算原始语音和受损语音响度之问的感知扰动,并依次在频域和时域进行聚合,从而获得单一的扰动值,该值再经认知模型计算,可以得到最终的客观评分.实验表明,所提算法的平均运行时间比国际电信联盟提出的语音质量感知评价算法减少了41%,内存占用降低了51%,而仅比主观评价的相关度下降6.8%.  相似文献   

12.
加权倒谱距离用于普通话客观音质评价   总被引:1,自引:3,他引:1  
本文主要讨论使用一种加权倒谱距离测量对通信系统或通信设备的话音质量进行客观音质评价。它是在使用LPC倒谱距离评价普通话语音质量的基础上发展起来的。这种度量方法是利用倒谱系数方差的倒数做权的一种统计加权距离度量。实验结果表明:这种加权倒谱距离度量结果优于LPC倒谱距离及其它度量方法。  相似文献   

13.
一种基于听觉掩蔽效应的语音增强方法   总被引:6,自引:1,他引:5  
为提高增强语音的听觉效果 ,研究了一种基于听觉掩蔽效应的语音增强方法。推出了一个功率谱域的基于听觉掩蔽效应的不等式准则 ,并用这个准则动态地选择一个作为语音短时谱幅度估计器的非线性函数的参数值 ,通过这个参数自适应变化的非线性函数对语音谱幅度进行估计实现语音增强。在此基础上 ,设计实现了一个单声道语音增强算法。对增强语音的客观测试和非正式听音测试表明 :相对于传统的减谱法和对数短时谱幅度最小均方误差估计增强法 ,基于听觉掩蔽效应的语音增强方法能更好地抑制背景噪声  相似文献   

14.
针对近讲场景,提出一种双麦克近讲语音增强算法。该算法基于耳间延时差(ITD)、耳间强度差(IID)特征来区分目标语音,利用声学掩蔽效应,实现目标语音对背景噪声的分离降噪。与传统的单麦克增强方法相比,该算法可消除多种类型噪声且对语音造成的损伤较小。实验表明:该算法能将8~33dB的白噪声、音乐噪声、广播噪声3种噪声类型的带噪语音的信噪比提高到36dB以上,同时保持较高的目标语音可懂度。对于冲击噪声的带噪语音也具有较好的降噪效果。  相似文献   

15.
为了进一步提高增强语音的质量,基于传统的贝叶斯非负矩阵分解语音增强算法,考虑语音帧内原子间的相关性,提出了一种新的改进贝叶斯非负矩阵分解语音增强算法。该算法可分为训练和增强2个阶段:训练阶段利用该算法分别对纯净语音和噪声进行训练,得到纯净语音和噪声字典;增强阶段利用训练得到的纯净语音和噪声字典组成的联合字典结合,计算带噪语音时变增益,并利用最小均方误差估计得到增强语音频谱,进而重构增强语音。实验结果表明,该算法的对数频谱距离值和主观语音质量评估打分均优于非负矩阵分解(NMF)和贝叶斯非负矩阵分解(BNMF)等传统的语音增强算法,特别是在低信噪比条件下,该算法增强的效果更佳。  相似文献   

16.
基于人耳听觉模型的语音质量客观评价方法   总被引:1,自引:0,他引:1  
将人耳听觉模型应用于语音质量客观评价 ,用听觉模型对语音作处理得到近似的短时语音频谱 ,在此基础上得到谱距离作为语音质量的评判标准 .实验结果表明这种方法与主观评价结果的相关度达到 0 .83  相似文献   

17.
统计语音合成使用隐Markov模型(HMM)作为声学特征的统计模型。提出了一种利用声学模型空间距离进行HMM的大尺度压缩的量化方法,通过对矢量量化码本进行的优选迭代步骤,减小压缩后的声道谱模型与原模型之间的声学距离,使通过量化模型合成的语音更加接近未量化模型。主观和客观测试结果显示:使用该方法进行声道谱模型的压缩,在压缩至原模型大小的0.06左右时,仍有约90%的评价得分认为合成语音的质量没有明显下降。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号