首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 78 毫秒
1.
对Itakura语音失真测度的改进   总被引:1,自引:0,他引:1  
提出了一种对Itakura语音失真测度的改进方法-感知谱失真(PSD)测度方法,该方法通过模拟人的听觉特性把语音短时谱转变为符合听觉特性的感知谱,再以感知谱为基础,结合Itakura测度的优点来度量语音失真程度。通过对不同质量的语音信号进行仿真实验以及与Itakura测度方法作对比实验,结果表明PSD测度克服了Itakura测度的不足,与语音质量的主观评价一致性较好,特别是在语音失真程度较大时PS  相似文献   

2.
一种改进的客观音质评价方法   总被引:4,自引:0,他引:4  
描述了利用人耳的听觉掩蔽效应来对巴克谱失真距离测度进行改进,并将这些测度应用在客观音质评价中,以提高主客观音质评价的相关度.改进的测度动态地确定语音信号每个巴克带的掩蔽门限,有选择性地计算失真距离,只包含听觉能够感知的失真.针对特定失真语音条件下的实验仿真结果表明,主客观评价结果之间具有更高的相关系数.可以推断这些测度作为对语音系统进行的客观音质评价,会具有好的有效性和实用性.  相似文献   

3.
语音信号中相位信息的听觉感知研究   总被引:4,自引:0,他引:4  
通过主观听觉测试实验,研究了语音信号中相位信息对人的听觉感知的影响.实验结果表明,保持语音信号的幅度谱不变,在改变其相位谱时,只要重建信号在时域中的包络不变,重建语音和原始语音就不存在主观听觉上的差异.重建语音的听觉感知效果主要取决于附加相位对频率的导数的起伏幅度.重建语音中不同频率分量之间的最大相对时移决定语音感知的质量,当最大相对时移小于10ms时,语音感知质量最优;只要相位失真带来的不同频率分量之间的最大相对时移小于20ms,就不会影响对连续语音的正常理解.  相似文献   

4.
阐述了Mel谱失真测度的概念,指出用Mel频率尺度可较充分地反映人耳对频率及幅度的非线性感知特性。在此基础上,针对孤立词语音识别,对常规LP倒谱特征提取方法进行改进,即将LP倒谱按符合人耳听觉特性的Mel尺度进行非线性变化,得到LP Mel倒谱系数(LPM-CC)作为特征参数。识别网络使用RBF神经网络,进行了孤立词语音识别。实验结果表明此种方法抗噪性能好,识别效率高。  相似文献   

5.
为了能方便、快捷、可靠地对失真语音进行语音清晰度性能评价,提出了一种基于语音分类的加权巴克谱失真语音清晰度客观评价算法SC-WBSD.该算法提出在巴克域中对清音帧、浊音帧及过渡音帧巴克带谱失真进行加权来求失真语音的客观失真测度.通过分析 3类语音的巴克谱失真测度与DRT分的相关程度,提出一组以相关系数的幂次方为权重的有效SC-WBSD权重矢量.实验结果表明,SC-WBSD方法和DRT分的相关度达到了0.924 73,与巴克谱失真测度算法相比提高了4%.  相似文献   

6.
介绍了语音失真测度系统的构成以及实现的算法思想.采用前端处理技术.实现了对重放语音信号进行分帧、端点检测等特征的提取,获得了以Mel尺度倒谱参数作为衡量语音失真测度的特征向量.采用动态时间弯折算法,获得了用于语音质量客观评价的语音失真测度.  相似文献   

7.
推广了Banach空中谱测度、可测函数关于谱测度的积分、谱算子及其约当分解到局部凸空间.得到定理1设T∈L(X)为谱算子,E()为其单位分解.定义算子S=Φ(λ),其中λ代表函数f(λ)=λ,称S为T的标部.则(i)D(S)在X中稠,且S是一个闭线性算子.(i)当T∈Lb(X)时,S∈L(X),且N=T-S是一拟幂零算子,NS=SN.(ii)在D(S)上成立T=S+N,其中N满足:任意有界闭集e∈ΣP,NE(e)X是一拟幂零算子,且SN=NS在X的某稠密子空间上成立  相似文献   

8.
用DSP技术开发的一种新的语音识别系统   总被引:2,自引:0,他引:2  
本文介绍了一种基于听觉谱特征参数的语音识别方法和系统.该系统采用高速DSP芯片TMS320C25,实现了语音信号的实时处理.用由此芯片开发的EISA插卡与计算机结合,构成了一个智能化语音输入实时识别系统.实验结果表明,在小词汇量特定人条件下,该系统的正识率可达到98%以上,在非特定人和有噪情况下,系统正识率分别为95%和90%以上.通过比较发现,该系统在正识率、抗噪性和鲁棒性等方面均比传统识别方法要好  相似文献   

9.
利用语音短时谱变化相对较慢、其邻近LSP(LineSpectrumPair)失量存在充分相关这一特性,提出了一种新的谱编码方法,即LSP编码的一步插值预测矢量量化。本文设计了一个18bit/frame分裂矢量量化方案用于量化预测残差,当帧变化周期为30ms时,平均谱失真仅为1.178dB。  相似文献   

10.
提出了一种高效心理声学模型语音质量评价(EPM-SQE)算法.该算法采用12阶美尔倒谱参数(MFCC)作为语音信号特征向量,其空间复杂度小于巴克谱.对MFCC进行相对谱(RASTA)滤波,可以突出快变信号对听觉感知的影响.将滤波后的参数映射为响度,由此模拟人的感知过程.计算原始语音和受损语音响度之问的感知扰动,并依次在频域和时域进行聚合,从而获得单一的扰动值,该值再经认知模型计算,可以得到最终的客观评分.实验表明,所提算法的平均运行时间比国际电信联盟提出的语音质量感知评价算法减少了41%,内存占用降低了51%,而仅比主观评价的相关度下降6.8%.  相似文献   

11.
基于输出的语音质量客观评价方法研究   总被引:1,自引:0,他引:1  
在分析语谱图基础上提出了一种基于输出的语音质量客观评价方法-度量语亦图密度分布特征MDCSD(Measuring Distribution Characteristics of Spectrogram Density) 方法。该方法通过计算功率谱二维联合概率分布特征来描述不同质量语音信号的语谱图特征,并以此来对语音质量进行了客观评价,实验结果表明该方法是一种性能良好的基于输出的客观评价方法,其评价结果与主观评价的相关度达到0.8左右。  相似文献   

12.
针对传统谱估计增强算法易产生语音畸变、导致语音清晰度低的问题,提出了一种失真控制下的短时谱估计语音增强的新算法.该算法首先引入语音畸变的客观度量参数,并根据这一参数得到抑制语音畸变的约束条件,然后结合人耳听觉掩蔽特性和无语音概率参数,修正最小均方误差对数谱估计函数,最后联立约束条件和估计函数,得到增强后的语音,从而实现了在噪声抑制和语音畸变之间的折中,改善了语音增强的效果.主观试听和客观测试结果均表明,与其他谱减法相比,在相同的信噪比和去噪度条件下,新算法的语音畸变度最小且几乎察觉不到音乐噪声.  相似文献   

13.
基于浊音语音谐波谱子带加权重建的抗噪声说话人识别   总被引:1,自引:0,他引:1  
提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率.  相似文献   

14.
加权倒谱距离用于普通话客观音质评价   总被引:1,自引:3,他引:1  
本文主要讨论使用一种加权倒谱距离测量对通信系统或通信设备的话音质量进行客观音质评价。它是在使用LPC倒谱距离评价普通话语音质量的基础上发展起来的。这种度量方法是利用倒谱系数方差的倒数做权的一种统计加权距离度量。实验结果表明:这种加权倒谱距离度量结果优于LPC倒谱距离及其它度量方法。  相似文献   

15.
针对谱减法增强语音后残留"音乐噪声"明显,影响语音清晰度的问题,在分析现有的噪声谱减算法基本特性的基础上,提出一种基于噪声短时谱动态估计的语音降噪方法.通过估计噪声短时功率谱及其变化趋势,动态调整谱减法中的过减系数,有效抑制残留噪声.仿真实验表明,新的谱减算法在提高语音信噪比的同时保持较小的失真度,具有较好的增强效果.  相似文献   

16.
本文提出一种最佳约束线性估计器,用于抑制语音信号不 相关加性噪声。该估计器是在给定信号失真度下,使噪声能量最小为准则来设计对真实语音信号的约束线性估计。文中证明这种最佳的约束线性估计器是一种输入噪声电平地的Wiener滤波器。  相似文献   

17.
在混合激励线性预测 (mixed excitation linear prediction, MELP) 模型的基础上,以超帧为单位,采用多帧联合编码技术,分模式对子帧的语音特征参数进行联合量化,实现了一种码率为600 bit/s的声码器。为了进一步减小量化误差,设计出了一种基于高斯混合模型的预测分类分裂矢量量化器(predictive switched split vector quantization based on Gauss mixture model, GMM-PSSVQ),该量化器对超帧中某些子帧的线谱频率进行量化,并利用帧间预测和线性插值等方法提高编码效率。采用谱失真对设计的矢量量化器进行性能评估,并分别与多级矢量量化和预测分裂矢量量化算法进行性能比较;通过客观感知语音质量评估和主观判断韵字测试对实现的声码器进行性能测试。测试结果表明,设计的矢量量化器平均谱失真最低,实现的声码器合成语音具有较高的清晰度和可懂度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号