首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
提出了一种对Itakura 语音失真测度的改进方法——感知谱失真(PSD) 测度方法,该方法通过模拟人的听觉特性把语音短时谱转变为符合听觉特性的感知谱,再以感知谱为基础,结合Itakura 测度的优点来度量语音失真程度.通过对不同质量的语音信号进行仿真实验以及与Itakura 测度方法作对比实验,结果表明PSD测度克服了Itakura 测度的不足,与语音质量的主观评价一致性较好,特别是在语音失真程度较大时PSD测度明显优于Itakura 测度.  相似文献   

2.
阐述了Mel谱失真测度的概念,指出用Mel频率尺度可较充分地反映人耳对频率及幅度的非线性感知特性。在此基础上,针对孤立词语音识别,对常规LP倒谱特征提取方法进行改进,即将LP倒谱按符合人耳听觉特性的Mel尺度进行非线性变化,得到LP Mel倒谱系数(LPM-CC)作为特征参数。识别网络使用RBF神经网络,进行了孤立词语音识别。实验结果表明此种方法抗噪性能好,识别效率高。  相似文献   

3.
语音信号中相位信息的听觉感知研究   总被引:4,自引:0,他引:4  
通过主观听觉测试实验,研究了语音信号中相位信息对人的听觉感知的影响.实验结果表明,保持语音信号的幅度谱不变,在改变其相位谱时,只要重建信号在时域中的包络不变,重建语音和原始语音就不存在主观听觉上的差异.重建语音的听觉感知效果主要取决于附加相位对频率的导数的起伏幅度.重建语音中不同频率分量之间的最大相对时移决定语音感知的质量,当最大相对时移小于10ms时,语音感知质量最优;只要相位失真带来的不同频率分量之间的最大相对时移小于20ms,就不会影响对连续语音的正常理解.  相似文献   

4.
一种改进的客观音质评价方法   总被引:4,自引:0,他引:4  
描述了利用人耳的听觉掩蔽效应来对巴克谱失真距离测度进行改进,并将这些测度应用在客观音质评价中,以提高主客观音质评价的相关度.改进的测度动态地确定语音信号每个巴克带的掩蔽门限,有选择性地计算失真距离,只包含听觉能够感知的失真.针对特定失真语音条件下的实验仿真结果表明,主客观评价结果之间具有更高的相关系数.可以推断这些测度作为对语音系统进行的客观音质评价,会具有好的有效性和实用性.  相似文献   

5.
为了能方便、快捷、可靠地对失真语音进行语音清晰度性能评价,提出了一种基于语音分类的加权巴克谱失真语音清晰度客观评价算法SC-WBSD.该算法提出在巴克域中对清音帧、浊音帧及过渡音帧巴克带谱失真进行加权来求失真语音的客观失真测度.通过分析 3类语音的巴克谱失真测度与DRT分的相关程度,提出一组以相关系数的幂次方为权重的有效SC-WBSD权重矢量.实验结果表明,SC-WBSD方法和DRT分的相关度达到了0.924 73,与巴克谱失真测度算法相比提高了4%.  相似文献   

6.
介绍了语音失真测度系统的构成以及实现的算法思想.采用前端处理技术.实现了对重放语音信号进行分帧、端点检测等特征的提取,获得了以Mel尺度倒谱参数作为衡量语音失真测度的特征向量.采用动态时间弯折算法,获得了用于语音质量客观评价的语音失真测度.  相似文献   

7.
提出一种结合SOFM失真的HMM语音识别方法,它直接将SOFM失真测度与左右型离散HMM相结合综合利用SOFM失真五HMM状态输出概率作为HMM的匹配失真测度。该方法既可以看作为基于VQ失真语音识别方法的推广,又可以看作为半连续HMM的一种特例。实验结果证明它具有良好的效果。  相似文献   

8.
用DSP技术开发的一种新的语音识别系统   总被引:2,自引:0,他引:2  
本文介绍了一种基于听觉谱特征参数的语音识别方法和系统.该系统采用高速DSP芯片TMS320C25,实现了语音信号的实时处理.用由此芯片开发的EISA插卡与计算机结合,构成了一个智能化语音输入实时识别系统.实验结果表明,在小词汇量特定人条件下,该系统的正识率可达到98%以上,在非特定人和有噪情况下,系统正识率分别为95%和90%以上.通过比较发现,该系统在正识率、抗噪性和鲁棒性等方面均比传统识别方法要好  相似文献   

9.
基于人耳听觉模型的语音质量客观评价方法   总被引:1,自引:0,他引:1  
将人耳听觉模型应用于语音质量客观评价 ,用听觉模型对语音作处理得到近似的短时语音频谱 ,在此基础上得到谱距离作为语音质量的评判标准 .实验结果表明这种方法与主观评价结果的相关度达到 0 .83  相似文献   

10.
基于人耳听觉模型的语音质量客观评价方法   总被引:11,自引:0,他引:11  
将人耳听觉模型应用于语音质量客观评价,用听觉模型对语音作处理得到挖的短时语音频谱,在此基础上得到谱距离作为语音质量的评判标准,实验结果表明这咱方法与主观评价结果的相关度达到0.83。  相似文献   

11.
VoIp的通话质量是影响其发展和推广的主要因素,是人们最为关注的问题,如何测试通话质量是VoIP中的一项关键技术。在分析影响VoIP通话质量因素的基础上,介绍了VoIP网络中端对端音频测试的主要内容和方法,并详细介绍了一种全新的语音质量客观评估方法-听觉语音质量测度(PSQM)。  相似文献   

12.
分析了宽带语音编解码过程中遇到的特殊问题和解决办法,并通过改进窄带语音TCX算法(主要包括系统合成滤波器的移位和将频域矢量分成高低两个矢量)实现了宽带语音压缩编码.该算法的运算量仅相当于一般CELP运算量的1/2,降低了对所用DSP的速度要求.实验证明重建语音质量有了明显改善,信噪比提高近3dB,主观听觉质量也有明显改善.同时还分析了频域量化对该系统的编码噪声的影响,认为2bit/sample来量化相位是比较恰当的,这样能充分发挥TCX算法优越性,获得较理想的编码效果.  相似文献   

13.
语音相位听觉特性在正弦模型语音编码中的运用   总被引:1,自引:0,他引:1  
通过分析语音相位的听觉特性,把这种听觉特性运用到基于正弦模型语音编码合成元音的相位处理中,只通过幅频信息和少量的原始相位信息来合成重建语音信号,仿真实验结果表明这种方法能改善合成信号中帧与帧之间的不连续性,使帧与帧之间能平滑过渡,能增加语音自然度,提高语音的合成质量。  相似文献   

14.
对基于ADSP2186的语音识别电话的硬件结构作了简明的介绍,并阐述了程序设计和内存空间管理的思想和方法。最后对语音识别电话的实用性进行了探讨。  相似文献   

15.
DSP语音控制器中MFCC参数的定点快速算法   总被引:2,自引:0,他引:2  
本文介绍了一个基于定点数字信号处理器ADSP2181的语音控制器,着重讨论了其语音特征参数计算方法。  相似文献   

16.
为了提高语音感知哈希算法的鲁棒性和识别小范围篡改定位的能力,利用人类听觉模型提出了一种语音感知哈希算法.该算法基于人类听觉特性,首先对倒谱系数MFCC算法每帧的滤波器数量进行控制,得到每帧语音的梅尔频率倒谱参数;其次对自适应梅尔倒谱系数MFCC参数和语音LPCC系数进行融合,并采用分块方法对特征矩阵进行处理,对特征块进行2DNMF分解运算,降低特征矩阵的复杂度;最后对分解后的系数矩阵进行哈希构造,得到语音感知哈希串,利用哈希匹配实现语音认证.结果表明:该算法可以有效提高哈希认证的鲁棒性,并能够实现语音小范围篡改定位功能.  相似文献   

17.
通过分析含噪语音信号的特点,引入能够兼顾人耳听觉特性的听觉感知小波变换,构造了新的小波阈值函数,并对小波变换分解后的阈值进行基于微粒群算法的分层优化.仿真实验表明,该方法在不同信噪比条件下均具有较好的去噪性能,语音的可懂度和听觉效果得到有效提高.  相似文献   

18.
提出了一种基于SDCN算法的鲁棒性语音命令识别。依赖于信噪比的倒谱正常化(SDCN)算法直接在倒谱域根据输入语音帧的信噪比(SNR)来增加一补偿矢量,从而恢复未受污染的净语音信号,补偿矢量直接从训练环境和测试环境中记录的语音倒谱中逐帧比较得到,该算法对退化的环境具有很强的鲁棒性,实验结果证明,该算法简单,有效。  相似文献   

19.
声学心理模型是对人听觉系统生理结构和人耳主观感知特性的数学抽象模型.这种模型已成功运用于宽带音频编码中.首次提出将声学心理模型原理应用于语音编码中感知加权滤波器的设计.通过对ITUG.723.16.3/5.3kb/s双速率编码算法中感知加权滤波器的改进,编码器的MOS分可以改善0.1~0.3,而且新算法所要求的计算量仅比原算法大0.26MIPS.基于声学心理模型的感知加权滤波器,与现有各类语音编码器中所用的感知加权滤波器相比,有自适应强、更符合人耳听觉特性、主观处理效果更佳的优点.  相似文献   

20.
推广了Banach空中谱测度、可测函数关于谱测度的积分、谱算子及其约当分解到局部凸空间.得到定理1设T∈L(X)为谱算子,E()为其单位分解.定义算子S=Φ(λ),其中λ代表函数f(λ)=λ,称S为T的标部.则(i)D(S)在X中稠,且S是一个闭线性算子.(i)当T∈Lb(X)时,S∈L(X),且N=T-S是一拟幂零算子,NS=SN.(ii)在D(S)上成立T=S+N,其中N满足:任意有界闭集e∈ΣP,NE(e)X是一拟幂零算子,且SN=NS在X的某稠密子空间上成立  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号