首页 | 本学科首页   官方微博 | 高级检索  
     

基于注意力机制的卷积循环网络语音降噪
作者姓名:徐浩森  姜囡  齐志坤
作者单位:中国刑事警察学院公安信息技术与情报学院,沈阳110854
基金项目:辽宁省科技厅联合开放基金机器人学国家重点实验室开放基金资助项目(2020-KF-12-11);中央高校基本科研业务费专项资金资助(3242019010);辽宁省自然科学(2019-ZD-0168);科技部国家重点研发专项项目(2017YFC0821005);教育部重点研究项目(E-AQGABQ20202710);证据科学教育部重点实验室开放(2021KFKT09)。
摘    要:不同噪声在频谱上具有不同的特性,为了解决卷积神经网络对含有不同噪声的语音降噪的局限性,通过引入通道注意力机制作为卷积循环网络的中间层,将卷积层中不同功能的卷积核赋予不同的权重,使模型在训练时能够对输入数据更有针对性地去除噪声部分,从而达到更好的降噪效果。针对含有15种噪声的含噪语音分别应用循环神经网络、编解码卷积网络和卷积循环神经网络等三种模型进行降噪处理,结果表明引入注意力机制的模型相比于其他两种模型,在感知语音质量评价(perceptual evaluation of speech quality, PESQ)和短时客观可懂度(short time objective intelligibility, STOI)评分上都有所提高,且引入注意力机制的模型能够更好地保留语音的谐波信息。

关 键 词:语音降噪  自编解码网络  卷积循环网络  通道注意力机制
收稿时间:2021-08-09
修稿时间:2022-01-10
本文献已被 万方数据 等数据库收录!
点击此处可从《科学技术与工程》浏览原始摘要信息
点击此处可从《科学技术与工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号