首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 59 毫秒
1.
语音质量的客观评价在语言自主学习中具有重大的意义.文章首先介绍了语音质量客观评价过程中语音信号的预处理单元;其次,介绍了不同的语音特征提取算法,比较选择了更符合人耳听觉模型的MFCC特征,并给出特征提取过程及结果;最后,比较当前评价模型(DTW和HMM)的优缺点,并提出了采用HMM模型进行评价的方法,设计系统验证了该方...  相似文献   

2.
基于人耳听觉模型的语音质量客观评价方法   总被引:1,自引:0,他引:1  
将人耳听觉模型应用于语音质量客观评价 ,用听觉模型对语音作处理得到近似的短时语音频谱 ,在此基础上得到谱距离作为语音质量的评判标准 .实验结果表明这种方法与主观评价结果的相关度达到 0 .83  相似文献   

3.
基于人耳听觉模型的语音质量客观评价方法   总被引:11,自引:0,他引:11  
将人耳听觉模型应用于语音质量客观评价,用听觉模型对语音作处理得到挖的短时语音频谱,在此基础上得到谱距离作为语音质量的评判标准,实验结果表明这咱方法与主观评价结果的相关度达到0.83。  相似文献   

4.
提出了采用模糊有向图支持向量机(FDGSVM)对基于输出的多语言语音样本进行语音质量评价的一种新方法.将多个可进行两类分类的模糊支持向量机组织成具有惟一根节点的有向图结构,得到多类分类器FDGSVM;提取待测语音信号的Mel倒谱系数并将其作为特征向量,再通过FDGSVM将特征向量映射到非线性划分的主观平均意见评分(MOS)区间,映射值即为输出的语音质量的客观评价结果.实验结果表明,所提算法获得的评测结果与主观MOS评价之间的相关度,在闭集测试时可达0.91,在开集测试时可达0.88.  相似文献   

5.
数字音频质量的评价方法有两种,一种是利用人耳主观的评价方法,另一种则是客观的评价方法。本人重点介绍数字音频质量的客观评价,对数字音频质量客观评价标准ITU-RBS.1387的原理进行了重点分析并指出其中的不足和相应的改进方法。  相似文献   

6.
为了能方便、快捷、可靠地对失真语音进行语音清晰度性能评价,提出了一种基于语音分类的加权巴克谱失真语音清晰度客观评价算法SC-WBSD.该算法提出在巴克域中对清音帧、浊音帧及过渡音帧巴克带谱失真进行加权来求失真语音的客观失真测度.通过分析 3类语音的巴克谱失真测度与DRT分的相关程度,提出一组以相关系数的幂次方为权重的有效SC-WBSD权重矢量.实验结果表明,SC-WBSD方法和DRT分的相关度达到了0.924 73,与巴克谱失真测度算法相比提高了4%.  相似文献   

7.
语音质量评价始终是语音处理系统研发中极为关心和重视的问题。要对日益庞杂的语音系统进行测评,研制灵活、方便、快捷、可靠的语音质量评价系统极其必要。通过介绍语音音质客观评价方法的基本原理,分析ITU—T最新建议标准P.862中的PESQ算法,最终提出了基于PESQ算法的语音音质客观评价系统的软硬件实现方案,并重点介绍了系统各部分的设计思想、实现难点以及解决策略。  相似文献   

8.
比较了几种语音通信质量评价算法,提出了一种新的方法即RMFSC(相对美尔谱系数法)。该方法考虑了人耳对频率非线性的感知特性,可以对信道噪声中人耳听不到的低频成分进行过滤,且突出快变信号。  相似文献   

9.
RASTA滤波在语音通信质量客观评价中应用的研究   总被引:2,自引:0,他引:2  
介绍了在语音通信质量客观评价中使用RASTA(Relative Spectra)滤波的研究结果。通过分别将RASTA滤波与感知线性预测(PLP,Perceptually Linear Prediction)方法和美倒谱(MFCC,Mel Frequency Cepstral Coefficient)方法相结合对通过短波或超短波信道的男女生文件进行拟合研究,均取得了比较好的效果。与PLP方法结合关系数提高了12%,与MFCC方法结合相关系数提高了4%。说明RASTA滤波对信道噪声的低频成分中人耳听不到的部分进行过滤的方法在语音通信质量客观评价中是有效的。  相似文献   

10.
提出一种新的复杂环境噪声下无参考源语音质量客观评价方法.该方法基于准干净语音构造和有参考源评价模型,实现接近于有参考源客观评价的性能.首先,采用改进的最小值控制递归平均算法和多带谱减法获得带噪语音的准干净语音;然后,将该准干净语音作为改进的主观语音质量评估(PESQ)算法的参考语音,计算参考语音与带噪语音之间的失真误差,获得带噪语音的客观评价分值.实验结果表明:该算法客观评分相关度达到0.927,与有参考源语音质量客观评价标准的相关度0.931相比,实现了99%的接近,与无参考源的客观评价标准相比,提高了7.4%.  相似文献   

11.
主要讨论了一种使用语音频谱动态特性的倒谱距离测量对通信系统或通信设备进行客观音质评价方法,它是在使用LPC倒谱距离评价普通话语音质量的基础上发展起来的,语音频谱动态特性是利用倒谱对时间的回归分析来表示的,这种度量方法中,使用倒谱系数,倒谱回归系数和能量回归系数3个参数的距离测量,在使用了谱包络信息的基础上,考虑了谱包络随时间的变化量及信号能量随时间的变化,比较了4种距离估算方法和主观音质评价(MO  相似文献   

12.
提出了一种对Itakura 语音失真测度的改进方法——感知谱失真(PSD) 测度方法,该方法通过模拟人的听觉特性把语音短时谱转变为符合听觉特性的感知谱,再以感知谱为基础,结合Itakura 测度的优点来度量语音失真程度.通过对不同质量的语音信号进行仿真实验以及与Itakura 测度方法作对比实验,结果表明PSD测度克服了Itakura 测度的不足,与语音质量的主观评价一致性较好,特别是在语音失真程度较大时PSD测度明显优于Itakura 测度.  相似文献   

13.
分组网络环境下的实时语音质量客观评价   总被引:1,自引:0,他引:1  
提出了一种利用前馈随机神经网络在分组网络中进行实时语音质量评价的新方法.从接收到的语音分组中提取美尔频率倒谱系数向量,利用实时传输控制协议计算语音分组传输过程中的丢包率、延迟和抖动,构成网络传输参数向量.将随机神经元组织成具有1个输入层、1个隐含层和1个输出层的3层前馈网络结构,再以上述2种向量作为输入的多类别信号,以相应的主观平均意见(MOS)评分值作为输出对网络进行训练,从而获得稳定的权值矩阵.利用训练过的网络进行多类别信号的语音质量评分映射,并将映射结果与MOS进行二次多项式拟合,得到最终的语音质量评分值.实验表明,所提算法与主观评价之间的平均相关度可达到0.881.  相似文献   

14.
加权倒谱距离用于普通话客观音质评价   总被引:1,自引:3,他引:1  
本文主要讨论使用一种加权倒谱距离测量对通信系统或通信设备的话音质量进行客观音质评价。它是在使用LPC倒谱距离评价普通话语音质量的基础上发展起来的。这种度量方法是利用倒谱系数方差的倒数做权的一种统计加权距离度量。实验结果表明:这种加权倒谱距离度量结果优于LPC倒谱距离及其它度量方法。  相似文献   

15.
在英语演讲培训过程中,要以加强素质教育为指导方针,狠狐学生思想素质、心理素质的培养活动基本功、演讲技巧的训练,以演讲为基本点,带动对学生全方位能力的培养。  相似文献   

16.
Objective Image Fusion Quality Evaluation Using Structural Similarity   总被引:2,自引:0,他引:2  
Objective evaluations of fused images are important in comparing the performance of different image fusion algorithms. This paper describes a structural similarity metric that does not use a reference image for image fusion evaluations. The metric is based on the universal image quality index and addresses not only the similarities between the input images and the fused image, but also the similarities among the input images. The evaluation process distinguishes between complementary information and redundant information using similarities among the input images. The metric uses the information classification to estimate how much structural similarity is preserved in the fused image. Tests demonstrate that the metric correlates well with subjective evaluations of the fused images.  相似文献   

17.
利用径向基函数网络(RBFN)进行语音质量客观评价, 以避免在回归分析中选取具体函数的困难. 选取3种距离测度而非语音文件本身作为神经网络的输入, 使得网络输入维数大大减小,网络结构大大简化. 且对径向基函数网络结构作了修正, 使其更便于作音质评价. 作者在网络参数和结构学习中采用平滑后的训练集, 有效减少了随机因素对客观评测结果的影响, 也大大减少了网络结构的复杂性. 主客观评价结果的相关性实验中, 相关系数达0.96以上, 这表明了该方法的可靠性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号