基于音节的维吾尔语大词汇连续语音识别系统 |
| |
引用本文: | 努尔麦麦提·尤鲁瓦斯,吾守尔·斯拉木,热依曼·吐尔逊.基于音节的维吾尔语大词汇连续语音识别系统[J].清华大学学报(自然科学版),2013(6):741-744. |
| |
作者姓名: | 努尔麦麦提·尤鲁瓦斯 吾守尔·斯拉木 热依曼·吐尔逊 |
| |
作者单位: | 新疆大学信息科学与工程学院 |
| |
基金项目: | 新疆维吾尔自治区科技援疆计划项目(201091106);新疆多语种信息处理重点实验室开放课题(049807) |
| |
摘 要: | 维吾尔语是一种黏着语,基于单词的语言模型不太适合于维吾尔语大词汇连续语音识别任务。该文提出了适合维吾尔语的基于音节的语言模型,引入最大匹配分词算法评价音节语言模型在大词汇连续语音识别任务中的单词识别性能。实验结果表明:基于音节的语言模型在未登录词和模型复杂度等方面表现出比基于单词的语言模型更加优越的性能,并且使识别系统的单元错误率比基于单词的系统减少了50%。因此,在维吾尔语语音识别任务上可以将音节作为识别单元。
|
关 键 词: | 维吾尔语 语音识别 音节语言模型 最大匹配算法 |
本文献已被 CNKI 等数据库收录! |
|