首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 203 毫秒
1.
基于听觉现象分析计算模型 (CASA)的基本原理 ,对仅有单通道输入混合语音信号时 ,采用振荡器神经网络 ,提出了一种 CASA计算模型语音分离算法结构 .利用实例说明了算法的具体实现步骤和参数设置 .讨论了该算法结构中各语音听觉感知成分 Segments的聚类过程和对分离输出语音的重构处理部分 ,以及如何采用合适的听觉感知成分聚类规则设计相应的聚类神经网络 ,以完成对应不同输入独立语音源信号的各 Segm ents的聚类 ,从而实现语音分离任务  相似文献   

2.
基于听觉现象分析(CASA)模型的基本原理,在仅有单通道输入混合语音信号时,采用振荡器神经网络,提出了一种CASA改进模型语音分离算法结构,文中利用一个实例说明了新算法的具体实现步骤,讨论了新算法机构中语音听觉外围处理部分和分割神经网络处理部分,通过上述两个部分的处理可以将输入混合语音信号在时频域上分割为若干有听觉感知意义的语音听觉感知成分分段Segments,以便于新算法后续处理分部中语音Segments的聚为和分离重构输出处理,最终完成语音分离任务。  相似文献   

3.
基于CASA简化模型的语音增强算法   总被引:2,自引:0,他引:2  
基于听觉现象分析(CASA)模型的基本原理,针对仅有非语音信号干扰情况下的单通道语音增强处理问题,利用人耳的频率掩蔽效应,提出了一种单通道简化CASA计算模型语音增强新算法,新算法通过提取混合语音输入中的有效语音时频成分并利用人耳的听觉掩蔽效应重构合成增强语音输出信号,通过在汽车噪声和白噪声干扰下的仿真实验结果表明,简化的CASA模型语音增强算法的输出信噪比约提高了10dB,且可以有效抑制干扰噪声的听觉影响,增强输出语音信号的可懂度。  相似文献   

4.
基于计算听觉场景分析(Computational Auditory Scene Analysis,CASA)的语音分离系统通过模拟人耳的听觉感知系统对混合信号进行处理并分离出感兴趣的目标语音,近年来得到了很大的发展。如何在干扰噪声存在的情况下进行正确的基音提取跟踪一直是CASA系统研究的重点。提出了一种基于目标语音源的改进基音跟踪算法。该算法通过对目标源估计和基音检测两个步骤的反复迭代计算,得到最终的基音轨迹。通过在不同噪声干扰条件下与传统基音跟踪算法对比的实验结果证明,该算法能够有效地抑制噪声,提高输出语音的信噪比和语音质量。  相似文献   

5.
针对单通道语音增强问题,基于计算听觉场景分析(CASA)的原理,提出了一种基于CASA计算模型的语音增强改进算法。该算法在特征提取中选择了目标语音有效能量、信道互相关等特征,对语谱能量和互相关特征的阈值选取进行了改进。在5种低信噪比噪声干扰条件下的仿真实验结果证明,该算法输出增强语音的信噪比平均提高了9.32dB,有效地抑制了噪声。  相似文献   

6.
为了使语音认证算法在真实噪声环境下具有更强的鲁棒性,提出一种基于伪谐波模型的强鲁棒语音感知哈希认证算法.该算法首先对待认证语音进行预处理后分帧、加窗;然后通过输入一定的参考频率对每帧信号构造伪谐波模型,使每个频率对应一个单一成分的模型分析信号,并利用模型分析信号的突出幅度信息作为语音信号的感知特征值;最后对感知特征值进行哈希构造,生成二进制感知哈希序列来实现语音认证.实验结果表明:该算法对较强的真实环境噪声和一些常规的内容保持操作具有非常好的鲁棒性,同时区分性和认证效率能够满足语音通信实时性的要求.  相似文献   

7.
语音信号中相位信息的听觉感知研究   总被引:4,自引:0,他引:4  
通过主观听觉测试实验,研究了语音信号中相位信息对人的听觉感知的影响.实验结果表明,保持语音信号的幅度谱不变,在改变其相位谱时,只要重建信号在时域中的包络不变,重建语音和原始语音就不存在主观听觉上的差异.重建语音的听觉感知效果主要取决于附加相位对频率的导数的起伏幅度.重建语音中不同频率分量之间的最大相对时移决定语音感知的质量,当最大相对时移小于10ms时,语音感知质量最优;只要相位失真带来的不同频率分量之间的最大相对时移小于20ms,就不会影响对连续语音的正常理解.  相似文献   

8.
为了解决语音分离中非负矩阵分解(non-negative matrix factorization,NMF)、深度神经网络(deep neural network,DNN)等算法没有考虑语音时序相关性的问题。结合NMF和长短时记忆网络(long short-term memory,LSTM)算法提出NMFLSTM单通道语音分离算法:将语音信号的幅度谱作为模型的输入特征,通过训练NMF和LSTM模型获得目标语音的基矩阵和系数矩阵,并对其结果进行语音重构最终实现语音分离。实验结果表明:相比于未考虑语音时间连续性的算法,使用NMFLSTM算法分离语音的客观语音质量评估值(perceptual evaluation of speech quality,PESQ)有明显提升,其最大值超过3. 1,获得良好的分离效果。  相似文献   

9.
听觉计算模型在自动语音识别中的作用   总被引:2,自引:0,他引:2  
听觉系统是语音信号处理过程不可分割的组成部分,听觉计算模型对自动语音识别研究具有非常重要的意义.简要评述了听觉计算模型近30年的研究进展,特别是近些年的研究成果,并指出听觉计算模型未来研究的主要方向.  相似文献   

10.
为了提高语音感知哈希算法的鲁棒性和识别小范围篡改定位的能力,利用人类听觉模型提出了一种语音感知哈希算法.该算法基于人类听觉特性,首先对倒谱系数MFCC算法每帧的滤波器数量进行控制,得到每帧语音的梅尔频率倒谱参数;其次对自适应梅尔倒谱系数MFCC参数和语音LPCC系数进行融合,并采用分块方法对特征矩阵进行处理,对特征块进行2DNMF分解运算,降低特征矩阵的复杂度;最后对分解后的系数矩阵进行哈希构造,得到语音感知哈希串,利用哈希匹配实现语音认证.结果表明:该算法可以有效提高哈希认证的鲁棒性,并能够实现语音小范围篡改定位功能.  相似文献   

11.
基于听觉模型的小波包变换的语音增强   总被引:8,自引:0,他引:8  
由于人耳频率分辨率是非线性的 ,用传统的线性信号处理方法 (如FFT)来模拟人耳基底膜的频率分析特性是比较困难的 .小波包算法有灵活的时频分析能力 ,可较好地符合人耳基底膜的频率分析特性 .在模拟人耳的听觉机理方面 ,用动态阈值法成功地对含噪语音进行了去噪处理 ,在去噪处理中引入音乐噪声的问题也较好地得到解决 .实验表明 :在单声道的条件下 ,其语音增强效果比传统的频谱减法有更高的清晰度和可懂度  相似文献   

12.
针对传统的RBF网络求取隐层基函数中心的K-均值聚类算法的缺点,利用文化算法的全局搜索性能,将文化算法用于语音识别系统的RBF网络的训练过程中,基于实验数据,指出该方法的识别结果较k-均值聚类算法有了明显的改善。  相似文献   

13.
一种基于听觉掩蔽效应的语音增强方法   总被引:6,自引:1,他引:5  
为提高增强语音的听觉效果 ,研究了一种基于听觉掩蔽效应的语音增强方法。推出了一个功率谱域的基于听觉掩蔽效应的不等式准则 ,并用这个准则动态地选择一个作为语音短时谱幅度估计器的非线性函数的参数值 ,通过这个参数自适应变化的非线性函数对语音谱幅度进行估计实现语音增强。在此基础上 ,设计实现了一个单声道语音增强算法。对增强语音的客观测试和非正式听音测试表明 :相对于传统的减谱法和对数短时谱幅度最小均方误差估计增强法 ,基于听觉掩蔽效应的语音增强方法能更好地抑制背景噪声  相似文献   

14.
通过分析含噪语音信号的特点,引入能够兼顾人耳听觉特性的听觉感知小波变换,构造了新的小波阈值函数,并对小波变换分解后的阈值进行基于微粒群算法的分层优化.仿真实验表明,该方法在不同信噪比条件下均具有较好的去噪性能,语音的可懂度和听觉效果得到有效提高.  相似文献   

15.
基于听觉模型的子波变换语音增强林宝成,富煜清黄志同(东南大学无线电工程系,南京210018)(南京理工大学自控系,南京210014)在许多实际的语音信号处理中,都迫切需要进行语音增强,例如,噪声环境中的语音识别[2]、语音编码、语音合成等。尽管有各种...  相似文献   

16.
在传统的HMM语音识别方法的基础上,提出了两种改进的竞争神经网络算法,分别用于语音识别的两个不同方面.首先提出了一种基于选择机制的新的竞争算法,这种算法可以有目的性地避免局部最优,而且可以克服模拟退火算法(SA)的随机性.然后,针对分类器的特性,对竞争算法进行改进,把安全拒识措施结合到竞争算法中,提出了一种新颖的神经网络——并行、自组织、层次神经网(PSHNN).实验结果表明,基于竞争神经网络算法的语音识别系统比传统的语音识别系统在识别能力和识别速度上都有明显提高,从而证明了与竞争神经网络算法结合的语音识别方法是可行的,而且具有良好的发展和应用前景.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号