首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于CTC与Transformer的普通话单音节发音错误检测
引用本文:杨兴耀,卢进堂,肖瑞,张利飞,曾利文.基于CTC与Transformer的普通话单音节发音错误检测[J].东北师大学报(自然科学版),2024(1):87-95.
作者姓名:杨兴耀  卢进堂  肖瑞  张利飞  曾利文
作者单位:1. 新疆大学软件学院;2. 新疆大学信息科学与工程学院
基金项目:新疆维吾尔自治区自然科学基金资助项目(2023D01C17);
摘    要:提出CTC与Transformer结合的端到端模型,使用多编码器和字层级一致的方法,降低在复杂录制环境下的识别错误率.该端到端模型在自建数据集PSC_Monosyllable的测试集上的词错误率为5.6%.通过预训练,可以实现发音错误检测的正误分类,且比传统机器学习模型检测结果性能提升了16%,有效地提升了发音错误检出率,得出了较好的结果,检测率为0.589.

关 键 词:语音识别  发音错误检测  语料库建设  深度学习  Transformer
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号