首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
基于人耳听觉模型的语音质量客观评价方法   总被引:11,自引:0,他引:11  
将人耳听觉模型应用于语音质量客观评价,用听觉模型对语音作处理得到挖的短时语音频谱,在此基础上得到谱距离作为语音质量的评判标准,实验结果表明这咱方法与主观评价结果的相关度达到0.83。  相似文献   

2.
语音质量的客观评价在语言自主学习中具有重大的意义.文章首先介绍了语音质量客观评价过程中语音信号的预处理单元;其次,介绍了不同的语音特征提取算法,比较选择了更符合人耳听觉模型的MFCC特征,并给出特征提取过程及结果;最后,比较当前评价模型(DTW和HMM)的优缺点,并提出了采用HMM模型进行评价的方法,设计系统验证了该方...  相似文献   

3.
听觉计算模型在自动语音识别中的作用   总被引:2,自引:0,他引:2  
听觉系统是语音信号处理过程不可分割的组成部分,听觉计算模型对自动语音识别研究具有非常重要的意义.简要评述了听觉计算模型近30年的研究进展,特别是近些年的研究成果,并指出听觉计算模型未来研究的主要方向.  相似文献   

4.
为了能够更加准确地评价语音包丢失对基于IP的语音传输(voice over internet protocol,VoIP)的语音质量的损伤,对ITU-T G.107建议书提出的语音质量预测模型E-Model中计算丢包与编码造成的损伤Ie-eff的方法作出改进,在综合考虑语音包的内部特性和存在突发连续丢包情况后,提出利用在固定语音长度下,语音实际损失时间Tloss来衡量语音包丢失造成的语音损伤.仿真结果表明,相比原有模型,改进后的模型得到的语音质量评分同主观语音质量评估方法(perceptual evaluation of speech quality,PESQ)评分相比,皮尔森相关系数平均提高了0.045 8,均方根误差平均降低了0.053 4,改进后的E-Model模型在评价语音质量时与PESQ更具有一致性,可以更为准确地预测VoIP通信的语音质量.  相似文献   

5.
对Itakura语音失真测度的改进   总被引:1,自引:0,他引:1  
提出了一种对Itakura语音失真测度的改进方法-感知谱失真(PSD)测度方法,该方法通过模拟人的听觉特性把语音短时谱转变为符合听觉特性的感知谱,再以感知谱为基础,结合Itakura测度的优点来度量语音失真程度。通过对不同质量的语音信号进行仿真实验以及与Itakura测度方法作对比实验,结果表明PSD测度克服了Itakura测度的不足,与语音质量的主观评价一致性较好,特别是在语音失真程度较大时PS  相似文献   

6.
一种无线局域网语音质量评价方法   总被引:1,自引:1,他引:0  
为了更真实地反应无线局域网的语音质量,分析了网络语音质量的评价方法,根据网络语音的影响因素和网络仿真的特点,提出了改进的评价模型,并使用原始语音数据进行网络仿真评价,最后结合不同的播放算法得到了不同客观条件下无线局域网语音质量的平均意见得分.分析结果表明:播放算法在网络条件无法确保最优的情况下,对语音质量的影响很大.  相似文献   

7.
为了提高语音感知哈希算法的鲁棒性和识别小范围篡改定位的能力,利用人类听觉模型提出了一种语音感知哈希算法.该算法基于人类听觉特性,首先对倒谱系数MFCC算法每帧的滤波器数量进行控制,得到每帧语音的梅尔频率倒谱参数;其次对自适应梅尔倒谱系数MFCC参数和语音LPCC系数进行融合,并采用分块方法对特征矩阵进行处理,对特征块进行2DNMF分解运算,降低特征矩阵的复杂度;最后对分解后的系数矩阵进行哈希构造,得到语音感知哈希串,利用哈希匹配实现语音认证.结果表明:该算法可以有效提高哈希认证的鲁棒性,并能够实现语音小范围篡改定位功能.  相似文献   

8.
语音相位听觉特性在正弦模型语音编码中的运用   总被引:1,自引:0,他引:1  
通过分析语音相位的听觉特性,把这种听觉特性运用到基于正弦模型语音编码合成元音的相位处理中,只通过幅频信息和少量的原始相位信息来合成重建语音信号,仿真实验结果表明这种方法能改善合成信号中帧与帧之间的不连续性,使帧与帧之间能平滑过渡,能增加语音自然度,提高语音的合成质量。  相似文献   

9.
无线局域网的语音应用日益广泛。本文分析了网络语音质量的评价方法,提出了改进的评价模型,使用原始语音数据进行网络仿真评价,得到了不同客观条件下无线局域网语音质量的平均意见得分,分析了不同的播放算法对语音质量的影响。  相似文献   

10.
提出一种新的复杂环境噪声下无参考源语音质量客观评价方法.该方法基于准干净语音构造和有参考源评价模型,实现接近于有参考源客观评价的性能.首先,采用改进的最小值控制递归平均算法和多带谱减法获得带噪语音的准干净语音;然后,将该准干净语音作为改进的主观语音质量评估(PESQ)算法的参考语音,计算参考语音与带噪语音之间的失真误差,获得带噪语音的客观评价分值.实验结果表明:该算法客观评分相关度达到0.927,与有参考源语音质量客观评价标准的相关度0.931相比,实现了99%的接近,与无参考源的客观评价标准相比,提高了7.4%.  相似文献   

11.
提出了一种对Itakura 语音失真测度的改进方法——感知谱失真(PSD) 测度方法,该方法通过模拟人的听觉特性把语音短时谱转变为符合听觉特性的感知谱,再以感知谱为基础,结合Itakura 测度的优点来度量语音失真程度.通过对不同质量的语音信号进行仿真实验以及与Itakura 测度方法作对比实验,结果表明PSD测度克服了Itakura 测度的不足,与语音质量的主观评价一致性较好,特别是在语音失真程度较大时PSD测度明显优于Itakura 测度.  相似文献   

12.
语音信号中相位信息的听觉感知研究   总被引:4,自引:0,他引:4  
通过主观听觉测试实验,研究了语音信号中相位信息对人的听觉感知的影响.实验结果表明,保持语音信号的幅度谱不变,在改变其相位谱时,只要重建信号在时域中的包络不变,重建语音和原始语音就不存在主观听觉上的差异.重建语音的听觉感知效果主要取决于附加相位对频率的导数的起伏幅度.重建语音中不同频率分量之间的最大相对时移决定语音感知的质量,当最大相对时移小于10ms时,语音感知质量最优;只要相位失真带来的不同频率分量之间的最大相对时移小于20ms,就不会影响对连续语音的正常理解.  相似文献   

13.
针对传统谱估计增强算法易产生语音畸变、导致语音清晰度低的问题,提出了一种失真控制下的短时谱估计语音增强的新算法.该算法首先引入语音畸变的客观度量参数,并根据这一参数得到抑制语音畸变的约束条件,然后结合人耳听觉掩蔽特性和无语音概率参数,修正最小均方误差对数谱估计函数,最后联立约束条件和估计函数,得到增强后的语音,从而实现了在噪声抑制和语音畸变之间的折中,改善了语音增强的效果.主观试听和客观测试结果均表明,与其他谱减法相比,在相同的信噪比和去噪度条件下,新算法的语音畸变度最小且几乎察觉不到音乐噪声.  相似文献   

14.
用DSP技术开发的一种新的语音识别系统   总被引:2,自引:0,他引:2  
本文介绍了一种基于听觉谱特征参数的语音识别方法和系统.该系统采用高速DSP芯片TMS320C25,实现了语音信号的实时处理.用由此芯片开发的EISA插卡与计算机结合,构成了一个智能化语音输入实时识别系统.实验结果表明,在小词汇量特定人条件下,该系统的正识率可达到98%以上,在非特定人和有噪情况下,系统正识率分别为95%和90%以上.通过比较发现,该系统在正识率、抗噪性和鲁棒性等方面均比传统识别方法要好  相似文献   

15.
在VC++环境下,提取PLAR特征参数,基于听觉特性和语谱特性的语音增强器作为预处理器,对语音信号首先进行降噪处理,建立了基于DTW的抗噪声说话人识别系统.实验结果表明,即使在信噪比比较低的情况下,该系统都会在一定程度上提高多种噪声环境下说话人识剐系统的识别性能.  相似文献   

16.
针对目前已有的改进相干滤波语音增强系统中噪声互功率谱估计方法运算效率低、准确性不足的问题,提出一种基于软语音存在概率的噪声互功率谱估计方法。通过计算语音信号的固定先验软语音存在概率代替语音活动检测器,得到噪声互功率谱的无偏估计值,以改善估计的准确性,同时还可避免复杂的偏差补偿值计算,使算法计算量得以减小。仿真实验结果表明,所提出的噪声互功率谱估计方法在应用于改进相干滤波语音增强系统时有更好的感知语音质量评价得分,且运算用时更短。  相似文献   

17.
基于输出的语音质量客观评价方法研究   总被引:1,自引:0,他引:1  
在分析语谱图基础上提出了一种基于输出的语音质量客观评价方法-度量语亦图密度分布特征MDCSD(Measuring Distribution Characteristics of Spectrogram Density) 方法。该方法通过计算功率谱二维联合概率分布特征来描述不同质量语音信号的语谱图特征,并以此来对语音质量进行了客观评价,实验结果表明该方法是一种性能良好的基于输出的客观评价方法,其评价结果与主观评价的相关度达到0.8左右。  相似文献   

18.
基于听觉模型的小波包变换的语音增强   总被引:8,自引:0,他引:8  
由于人耳频率分辨率是非线性的 ,用传统的线性信号处理方法 (如FFT)来模拟人耳基底膜的频率分析特性是比较困难的 .小波包算法有灵活的时频分析能力 ,可较好地符合人耳基底膜的频率分析特性 .在模拟人耳的听觉机理方面 ,用动态阈值法成功地对含噪语音进行了去噪处理 ,在去噪处理中引入音乐噪声的问题也较好地得到解决 .实验表明 :在单声道的条件下 ,其语音增强效果比传统的频谱减法有更高的清晰度和可懂度  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号