首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 27 毫秒
1.
基于人耳听觉模型的语音质量客观评价方法   总被引:1,自引:0,他引:1  
将人耳听觉模型应用于语音质量客观评价 ,用听觉模型对语音作处理得到近似的短时语音频谱 ,在此基础上得到谱距离作为语音质量的评判标准 .实验结果表明这种方法与主观评价结果的相关度达到 0 .83  相似文献   

2.
采用聚类神经网络与分离输出语音重构的语音分离算法   总被引:1,自引:1,他引:0  
基于听觉现象分析计算模型 ( CASA)的基本原理 ,对仅有单通道输入混合语音信号时 ,采用振荡器神经网络 ,提出了一种 CASA计算模型语音分离算法结构 .利用实例说明了算法的具体实现步骤和参数设置 .讨论了该算法结构中各语音听觉感知成分 Segments的聚类过程和对分离输出语音的重构处理部分 ,以及如何采用合适的听觉感知成分聚类规则设计相应的聚类神经网络 ,以完成对应不同输入独立语音源信号的各 Segments的聚类 ,从而实现语音分离任务  相似文献   

3.
基于CASA简化模型的语音增强算法   总被引:2,自引:0,他引:2  
基于听觉现象分析(CASA)模型的基本原理,针对仅有非语音信号干扰情况下的单通道语音增强处理问题,利用人耳的频率掩蔽效应,提出了一种单通道简化CASA计算模型语音增强新算法,新算法通过提取混合语音输入中的有效语音时频成分并利用人耳的听觉掩蔽效应重构合成增强语音输出信号,通过在汽车噪声和白噪声干扰下的仿真实验结果表明,简化的CASA模型语音增强算法的输出信噪比约提高了10dB,且可以有效抑制干扰噪声的听觉影响,增强输出语音信号的可懂度。  相似文献   

4.
一种基于听觉模型的抗噪语音识别特征提取方法   总被引:5,自引:2,他引:5  
提出了一种新的语音识别特征提取方法。该方法是建立在听觉模型的基础上,通过计算语音的上升过零率作为频率信息并通过非线性幅度加权相结合来获取语音特征。仿真实现了中小词汇量、孤立词的语音识别,得到了较好的实验结果,证明了此方法具有较强的抗噪声性能。  相似文献   

5.
基于人耳听觉模型的语音质量客观评价方法   总被引:11,自引:0,他引:11  
将人耳听觉模型应用于语音质量客观评价,用听觉模型对语音作处理得到挖的短时语音频谱,在此基础上得到谱距离作为语音质量的评判标准,实验结果表明这咱方法与主观评价结果的相关度达到0.83。  相似文献   

6.
动态阈值谱法语音增强   总被引:2,自引:0,他引:2  
根据人耳能从噪声中提取有用信息的听觉特征,并结合语音信号的基本特征,提出并研究了一个适合于语音增强的听党内模型;实验结果表明,这个方法不仅在提高语音信噪比方面,而且在减小语音失真度方面均有较好的改善。  相似文献   

7.
语音质量的客观评价在语言自主学习中具有重大的意义.文章首先介绍了语音质量客观评价过程中语音信号的预处理单元;其次,介绍了不同的语音特征提取算法,比较选择了更符合人耳听觉模型的MFCC特征,并给出特征提取过程及结果;最后,比较当前评价模型(DTW和HMM)的优缺点,并提出了采用HMM模型进行评价的方法,设计系统验证了该方...  相似文献   

8.
语音相位听觉特性在正弦模型语音编码中的运用   总被引:1,自引:0,他引:1  
通过分析语音相位的听觉特性,把这种听觉特性运用到基于正弦模型语音编码合成元音的相位处理中,只通过幅频信息和少量的原始相位信息来合成重建语音信号,仿真实验结果表明这种方法能改善合成信号中帧与帧之间的不连续性,使帧与帧之间能平滑过渡,能增加语音自然度,提高语音的合成质量。  相似文献   

9.
针对单通道语音增强问题,基于计算听觉场景分析(CASA)的原理,提出了一种基于CASA计算模型的语音增强改进算法。该算法在特征提取中选择了目标语音有效能量、信道互相关等特征,对语谱能量和互相关特征的阈值选取进行了改进。在5种低信噪比噪声干扰条件下的仿真实验结果证明,该算法输出增强语音的信噪比平均提高了9.32dB,有效地抑制了噪声。  相似文献   

10.
为了提高语音感知哈希算法的鲁棒性和识别小范围篡改定位的能力,利用人类听觉模型提出了一种语音感知哈希算法.该算法基于人类听觉特性,首先对倒谱系数MFCC算法每帧的滤波器数量进行控制,得到每帧语音的梅尔频率倒谱参数;其次对自适应梅尔倒谱系数MFCC参数和语音LPCC系数进行融合,并采用分块方法对特征矩阵进行处理,对特征块进行2DNMF分解运算,降低特征矩阵的复杂度;最后对分解后的系数矩阵进行哈希构造,得到语音感知哈希串,利用哈希匹配实现语音认证.结果表明:该算法可以有效提高哈希认证的鲁棒性,并能够实现语音小范围篡改定位功能.  相似文献   

11.
基于修正MFCC参数汉语耳语音的话者识别   总被引:12,自引:1,他引:12  
耳语音的话者识别是一个较新的研究课题,许多参数模型与正常音存在差异.例如话者识别中常见的M el倒谱系数(MFCC)应用于耳语音中就存在共振峰和听觉敏感区域定位的偏差.基于对耳语音共振峰位置、能量以及人耳对耳语音听觉模型的研究提出了修正MFCC参数MFCCM和MFCCExp-Log,并结合两种参数的特点,改进了传统隐马尔可夫模型,建立了适用于耳语音的汉语话者识别系统.通过1 600个音的话者识别实验得出采用MFCCM的正确率为88.88%;MFCCExp-Log参数为91.38%;如果采用改进隐马尔可夫模型正确率可以提高到92.31%,均高于传统参数模型.实验表明,修正MFCC参数可以作为表征耳语音特点的参数,它提高了耳语音话者识别系统的识别率.  相似文献   

12.
基于听觉现象分析(CASA)模型的基本原理,在仅有单通道输入混合语音信号时,采用振荡器神经网络,提出了一种CASA改进模型语音分离算法结构,文中利用一个实例说明了新算法的具体实现步骤,讨论了新算法机构中语音听觉外围处理部分和分割神经网络处理部分,通过上述两个部分的处理可以将输入混合语音信号在时频域上分割为若干有听觉感知意义的语音听觉感知成分分段Segments,以便于新算法后续处理分部中语音Segments的聚为和分离重构输出处理,最终完成语音分离任务。  相似文献   

13.
研究如何从听觉模型的自相关谱中恢复出原始的声音信号.从短时自相关函数中得到原始信号的傅立叶变换的幅度值,然后利用迭代算法仅从傅立叶变换的幅度值中恢复语音信号.  相似文献   

14.
基于计算听觉场景分析(Computational Auditory Scene Analysis,CASA)的语音分离系统通过模拟人耳的听觉感知系统对混合信号进行处理并分离出感兴趣的目标语音,近年来得到了很大的发展。如何在干扰噪声存在的情况下进行正确的基音提取跟踪一直是CASA系统研究的重点。提出了一种基于目标语音源的改进基音跟踪算法。该算法通过对目标源估计和基音检测两个步骤的反复迭代计算,得到最终的基音轨迹。通过在不同噪声干扰条件下与传统基音跟踪算法对比的实验结果证明,该算法能够有效地抑制噪声,提高输出语音的信噪比和语音质量。  相似文献   

15.
声学心理模型是对人听觉系统生理结构和人耳主观感知特性的数学抽象模型.这种模型已成功运用于宽带音频编码中.首次提出将声学心理模型原理应用于语音编码中感知加权滤波器的设计.通过对ITUG.723.16.3/5.3kb/s双速率编码算法中感知加权滤波器的改进,编码器的MOS分可以改善0.1~0.3,而且新算法所要求的计算量仅比原算法大0.26MIPS.基于声学心理模型的感知加权滤波器,与现有各类语音编码器中所用的感知加权滤波器相比,有自适应强、更符合人耳听觉特性、主观处理效果更佳的优点.  相似文献   

16.
听觉性失语症病例在逐年增加,针对不同情况的脑功能区受损失语症病例,要采用不同的康复计划.而对于语言脑功能区的精确定位和准确定论是康复治疗的前提和重点.该文从听觉语义加工和听觉语音加工两个部分对语言脑区的听觉fMRI研究成果进行概述.基于前人的研究成果,对近年相关研究进行总结和展望,以期推动失语症康复治疗的发展.  相似文献   

17.
基于MFCC的语音情感识别   总被引:4,自引:0,他引:4  
情感语音中携带着丰富的信息,在人机交互领域有着广阔的应用.Mel频率是基于人耳听觉特性提出来的.它与Hz频率成非线性对应关系.Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征,MFCC已经广泛地应用在语音识别领域.由于Mel频率与Hz频率之间非线性的对应关系,使得MFCC随着频率的提高,其计算精度随之下降.因此,在应用中常常只使用低频MFCC,而丢弃中高频MFCC.针对该问题进行了研究,修正了Hz-Mel非线性对应关系,提升了中高频系数的计算精度,并将其作为低频MFCC的补充,应用到语音情感识别中.实验证明,改进之后的算法与经典算法比较,在不同的特征组合上识别率都有不同程度的提高,从而证明了Mid MFCC特征计算方法的有效性.  相似文献   

18.
语音信号中相位信息的听觉感知研究   总被引:4,自引:0,他引:4  
通过主观听觉测试实验,研究了语音信号中相位信息对人的听觉感知的影响.实验结果表明,保持语音信号的幅度谱不变,在改变其相位谱时,只要重建信号在时域中的包络不变,重建语音和原始语音就不存在主观听觉上的差异.重建语音的听觉感知效果主要取决于附加相位对频率的导数的起伏幅度.重建语音中不同频率分量之间的最大相对时移决定语音感知的质量,当最大相对时移小于10ms时,语音感知质量最优;只要相位失真带来的不同频率分量之间的最大相对时移小于20ms,就不会影响对连续语音的正常理解.  相似文献   

19.
对Itakura语音失真测度的改进   总被引:1,自引:0,他引:1  
提出了一种对Itakura语音失真测度的改进方法-感知谱失真(PSD)测度方法,该方法通过模拟人的听觉特性把语音短时谱转变为符合听觉特性的感知谱,再以感知谱为基础,结合Itakura测度的优点来度量语音失真程度。通过对不同质量的语音信号进行仿真实验以及与Itakura测度方法作对比实验,结果表明PSD测度克服了Itakura测度的不足,与语音质量的主观评价一致性较好,特别是在语音失真程度较大时PS  相似文献   

20.
对两类在国际上得到广泛接受的响度模型即Moore和Zwicker时变响度模型及ITU(国际电信联盟)标准推荐响度模型进行了对比研究.通过耳机回放的主观听音实验评估了这两类响度模型在计算汉语语音素材总响度时的有效性.模型的评价采用了4种不同的统计量,对模型的绝对精度和相对精度进行了度量.研究发现,ITU-R BS.1770-4推荐响度模型相对简单,更易于对语音素材的总响度进行度量;在计算汉语语音素材的总响度时,ITU标准推荐响度模型比Moore和Zwicker时变响度模型的精度高,提高了0.5~2 dB.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号