基于深度学习的听觉倒谱系数语音增强算法 |
| |
引用本文: | 李如玮,孙晓月,刘亚楠,李涛. 基于深度学习的听觉倒谱系数语音增强算法[J]. 华中科技大学学报(自然科学版), 2019, 47(9): 78-83 |
| |
作者姓名: | 李如玮 孙晓月 刘亚楠 李涛 |
| |
作者单位: | 北京工业大学信息学部信息与通信工程学院,北京,100124;北京工业大学信息学部信息与通信工程学院,北京,100124;北京工业大学信息学部信息与通信工程学院,北京,100124;北京工业大学信息学部信息与通信工程学院,北京,100124 |
| |
基金项目: | 北京市教委科技面上项目;国家自然科学基金 |
| |
摘 要: | 针对现有语音增强算法在低信噪比(SNR)非平稳噪声环境下的表现并不理想这一问题,提出了一种基于深度学习的语音增强算法.首先,构建了一个深度神经网络(DNN),然后从四个不同分辨率的耳蜗中提取了多分辨率听觉倒谱系数(MRACC)作为神经网络的输入,该系数既关注了细节的高分辨率特征,又把握了全局性的低分辨率特征;其次,跟踪噪声变化构建了一个自适应掩蔽阈值(AM)作为神经网络的训练目标,该阈值能够依据噪声调节理想二值掩蔽(IBM)和理想软掩蔽(IRM)的权重;最后,将估计的自适应掩蔽阈值用于对含噪语音进行增强.实验结果表明:相较于对比算法,该算法不仅可以进一步提高语音质量和可懂度,而且能够抑制更多的噪声.
|
关 键 词: | 语音增强 深度神经网络 听觉倒谱系数 自适应掩蔽阈值 低信噪比 噪声跟踪 |
Speech enhancement based on auditory cepstral coefficient with deep learning |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 CNKI 万方数据 等数据库收录! |
|