基于CTC与Transformer的普通话单音节发音错误检测期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于CTC与Transformer的普通话单音节发音错误检测

引用本文：	杨兴耀,卢进堂,肖瑞,张利飞,曾利文.基于CTC与Transformer的普通话单音节发音错误检测[J].东北师大学报(自然科学版),2024(1):87-95.

作者姓名：	杨兴耀卢进堂肖瑞张利飞曾利文

作者单位：	1. 新疆大学软件学院;2. 新疆大学信息科学与工程学院

基金项目：	新疆维吾尔自治区自然科学基金资助项目(2023D01C17)；

摘要：	提出CTC与Transformer结合的端到端模型，使用多编码器和字层级一致的方法，降低在复杂录制环境下的识别错误率.该端到端模型在自建数据集PSC＿Monosyllable的测试集上的词错误率为5.6%.通过预训练，可以实现发音错误检测的正误分类，且比传统机器学习模型检测结果性能提升了16%,有效地提升了发音错误检出率，得出了较好的结果，检测率为0.589.
关键词：	语音识别发音错误检测语料库建设深度学习 Transformer