摘 要: | [目的]针对基于深度神经网络频谱估计的麦克风阵列算法存在数据依赖的问题,提出了一种基于深度学习的混响感知麦克风阵列语音增强算法.[方法]首先利用麦克风阵列波束形成输出与原始信号做互相关,以近似房间冲激响应的形式获取当前环境的混响特性作为LSTM网络的输入,网络模型以干净语音为目标进行训练从而输出房间冲激响应泛化向量,最后通过组合近似房间冲激响应与房间冲激响应泛化向量获得后置抗混响滤波器系数,实现语音增强.[结果]仿真和实验结果中,与波束形成、加权预测误差算法和传统深度学习去混响算法相比,所提出的方法在不同混响场景下具有更好的表现.[结论]本文方法在不同混响场景下都具有相对稳定的抗混响能力,具有较好的泛化性能.
|