首页 | 本学科首页   官方微博 | 高级检索  
     检索      

融合形态特征的最大熵维吾尔语词性标注
作者单位:;1.西北大学信息学院;2.新疆大学软件学院
摘    要:根据维吾尔语黏着型的特点,以及形态化单词和频率进行统计分析之后的结果,为解决因单词形态而导致的数据稀疏问题和兼类词标注的问题,提出了维吾尔文的融合词干、词缀等形态特征的基于最大熵的词性标注模型。在通用的词性标注模型的基础上,构造了相应的词性标注特征模版,并设计了它的特征函数。实验结果分析表明,最大熵模型可以较好地处理维吾尔文词性标注的问题,其中词缀特征对提高兼类词和未登录词的词性标注有着十分显著的效果,与其他只用词形的词性标注系统相比准确率比以前提高了2.64%,达到了96.85%。

关 键 词:维吾尔语  词性标注  词缀  最大熵  特征提取

Fusion of morphological features for Uyghur part-of-speech tagging based on maximum entropy model
Abstract:
Keywords:
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号