首页
|
本学科首页
官方微博
|
高级检索
全部专业
非线性科学
系统科学
学报及综合类
自然科学丛书、文集、连续性出版物
自然科学教育与普及
自然科学理论与方法论
自然科学现状及发展
自然科学研究方法
按
中文标题
英文标题
中文关键词
英文关键词
中文摘要
英文摘要
作者中文名
作者英文名
单位中文名
单位英文名
基金中文名
基金英文名
杂志中文名
杂志英文名
栏目英文名
栏目英文名
DOI
责任编辑
分类号
杂志ISSN号
检索
融合形态特征的最大熵维吾尔语词性标注
作者单位:
;1.西北大学信息学院;2.新疆大学软件学院
摘 要:
根据维吾尔语黏着型的特点,以及形态化单词和频率进行统计分析之后的结果,为解决因单词形态而导致的数据稀疏问题和兼类词标注的问题,提出了维吾尔文的融合词干、词缀等形态特征的基于最大熵的词性标注模型。在通用的词性标注模型的基础上,构造了相应的词性标注特征模版,并设计了它的特征函数。实验结果分析表明,最大熵模型可以较好地处理维吾尔文词性标注的问题,其中词缀特征对提高兼类词和未登录词的词性标注有着十分显著的效果,与其他只用词形的词性标注系统相比准确率比以前提高了2.64%,达到了96.85%。
关 键 词:
维吾尔语
词性标注
词缀
最大熵
特征提取
Fusion of morphological features for Uyghur part-of-speech tagging based on maximum entropy model
Abstract:
Keywords:
本文献已被
CNKI
等数据库收录!
设为首页
|
免责声明
|
关于勤云
|
加入收藏
Copyright
©
北京勤云科技发展有限公司
京ICP备09084417号