基于深度学习的听觉倒谱系数语音增强算法 Speech enhancement based on auditory cepstral coefficient with deep learning期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于深度学习的听觉倒谱系数语音增强算法

引用本文：	李如玮,孙晓月,刘亚楠,李涛. 基于深度学习的听觉倒谱系数语音增强算法[J]. 华中科技大学学报(自然科学版), 2019, 47(9): 78-83

作者姓名：	李如玮孙晓月刘亚楠李涛

作者单位：	北京工业大学信息学部信息与通信工程学院,北京,100124;北京工业大学信息学部信息与通信工程学院,北京,100124;北京工业大学信息学部信息与通信工程学院,北京,100124;北京工业大学信息学部信息与通信工程学院,北京,100124

基金项目：	北京市教委科技面上项目;国家自然科学基金

摘要：	针对现有语音增强算法在低信噪比(SNR)非平稳噪声环境下的表现并不理想这一问题,提出了一种基于深度学习的语音增强算法.首先,构建了一个深度神经网络(DNN),然后从四个不同分辨率的耳蜗中提取了多分辨率听觉倒谱系数(MRACC)作为神经网络的输入,该系数既关注了细节的高分辨率特征,又把握了全局性的低分辨率特征;其次,跟踪噪声变化构建了一个自适应掩蔽阈值(AM)作为神经网络的训练目标,该阈值能够依据噪声调节理想二值掩蔽(IBM)和理想软掩蔽(IRM)的权重;最后,将估计的自适应掩蔽阈值用于对含噪语音进行增强.实验结果表明:相较于对比算法,该算法不仅可以进一步提高语音质量和可懂度,而且能够抑制更多的噪声.
关键词：	语音增强深度神经网络听觉倒谱系数自适应掩蔽阈值低信噪比噪声跟踪
Speech enhancement based on auditory cepstral coefficient with deep learning

Abstract:

Keywords:
本文献已被 CNKI 万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏