首页 | 本学科首页   官方微博 | 高级检索  
     

哈萨克语NP和VP结构的歧义类型与消除策略研究
作者姓名:木合亚提·尼亚孜别克  古力沙吾利·塔里甫  古丽拉·阿东别克
作者单位:新疆大学信息科学与工程学院;新疆多语种信息技术实验室;国家语言资源监测与研究中心少数民族语言中心哈萨克和柯尔克孜语文基地;新疆医科大学中医学院;
基金项目:新疆维吾尔自治区多语种信息技术实验室开放课题资助项目(XJDX0905-2013-03)
摘    要:以现代哈萨克语短语识别与短语块库构建技术研究工程为背景,以NP和VP结构的歧义类型研究及消除为目的,提取统计方法来处理NP和VP结构的歧义问题.该方法在已经统计与分析出的哈萨克语短语基础上,对哈萨克语NP和VP短语组合结构歧义做全面分析和整理.用互信息方法解决NP和VP的歧义问题准确率(72%)并不高.为了达到更好的准确率就需要数量较大的训练语料库,但是目前实验环境并没有足够的语料.因此,基于规则方法标注好语料并采用人工方式完善训练语料库,再使用最大熵方法来处理歧义问题.实验结果表明,基于统计方法解决NP和VP结构的歧义问题是有效的,其准确率在封闭测试中达到了80.1%.

关 键 词:哈萨克语  最大熵模型  NP VP搭配  歧义消除
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号