首页 | 本学科首页   官方微博 | 高级检索  
     

词典和统计相结合的维吾尔文拼写查错方法的研究
作者姓名:吐尔根·依步拉音  吾守尔·斯拉木  麦合甫热提  艾山·吾买尔
摘    要:本文以维吾尔语拼写检查方法作为研究对象,提出以词典、形态分析、统计为基础的拼写检查方法。维吾尔语是黏着语言,富于形态变化,难以把单词的所有形态收录到词库里。因此,拼写检查时把词干提取方法与词典结合使用。为了保证词干和词缀连接的可靠性,建立基于统计的词干和词缀连接判断模型。上述的方法仅仅能处理词典中存在的单词。因此,在N元语法模型的基础上建立拼写查错模型,准确率为68.58%,一般词典能覆盖80%以上单词,结合统计方法后,差错准确率提高到93.6%以上。

关 键 词:N元语法模型  拼写检查  困惑度  
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号