基于CTC与Transformer的普通话单音节发音错误检测 |
| |
引用本文: | 杨兴耀,卢进堂,肖瑞,张利飞,曾利文.基于CTC与Transformer的普通话单音节发音错误检测[J].东北师大学报(自然科学版),2024(1):87-95. |
| |
作者姓名: | 杨兴耀 卢进堂 肖瑞 张利飞 曾利文 |
| |
作者单位: | 1. 新疆大学软件学院;2. 新疆大学信息科学与工程学院 |
| |
基金项目: | 新疆维吾尔自治区自然科学基金资助项目(2023D01C17); |
| |
摘 要: | 提出CTC与Transformer结合的端到端模型,使用多编码器和字层级一致的方法,降低在复杂录制环境下的识别错误率.该端到端模型在自建数据集PSC_Monosyllable的测试集上的词错误率为5.6%.通过预训练,可以实现发音错误检测的正误分类,且比传统机器学习模型检测结果性能提升了16%,有效地提升了发音错误检出率,得出了较好的结果,检测率为0.589.
|
关 键 词: | 语音识别 发音错误检测 语料库建设 深度学习 Transformer |
|
|