基于CGRU多输入特征的地空通话自动切分期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于CGRU多输入特征的地空通话自动切分

作者姓名：	郭东岳林毅杨波

作者单位：	四川大学视觉合成图形图像技术国防重点学科实验室,成都 610065;四川大学视觉合成图形图像技术国防重点学科实验室,成都 610065;四川大学计算机学院,成都 610065

基金项目：	国家自然科学基金委员会与中国民用航空局联合项目（U1833115）

摘要：	自动语音切分是语音识别、声纹识别、语音降噪等语音应用中非常重要的预处理环节,切分算法的优劣直接影响了系统输出结果的精度.在空管地空通话中,传输信道噪声、天气因素以及说话人工作状态均会对语音信号产生影响,进而在一定程度上影响语音切分性能.在分析空管地空通话语音特性基础上,提出了一种基于CGRU网络多输入特征的自动语音切分方法.该方法结合地空通话的特点,采用深度学习的方法进一步提取语音信号的时域和频域非线性特征,将语音信号帧分类为语音帧、结束帧以及其他帧三类.实验对比了多种语音特征作为输入对切分效果的影响,同时验证了GMM、CNN、CLDNN、CGRU等切分算法在真实地空通话测试集上的表现,并提出了一种简单预测结果平滑算法.实验结果表明,文中提出的自动切分方法在地空通话中具有明显优势,分类模型的AUC值达到了0.98.
关键词：	语音切分语音端点检测地空通话卷积神经网络循环神经网络
收稿时间：	2019-06-25
修稿时间：	2019-12-19
本文献已被万方数据等数据库收录！
	点击此处可从《四川大学学报(自然科学版)》浏览原始摘要信息
	点击此处可从《四川大学学报(自然科学版)》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏