首页 | 本学科首页   官方微博 | 高级检索  
     

对蒙古语语料库的短语标注
引用本文:华沙宝 达胡白乙拉. 对蒙古语语料库的短语标注[J]. 中央民族学院学报, 2006, 33(5): 64-67
作者姓名:华沙宝 达胡白乙拉
作者单位:内蒙古大学蒙古学学院,内蒙古呼和浩特010021
基金项目:本研究为国家社会科学基金(批准号为02BYY036)和国家自然科学基金(批准号为60263001)项目.
摘    要:通过本项研究,我们对100万词级现代蒙古语语料库做了短语标注,建立了现代蒙古语基本短语库。这一成果。对今后建立一个面向信息处理的、具有较强通用性的蒙古语语义分类和描述体系,提供了必要的前提条件。局部测试结果表明,标注软件对简单句子标注基本短语的召回率和准确率分别达到了92.93%和86.79%。今后有必要深入研究语义信息的获取、语法信息的细化以及蒙古语短语的歧义结构种类、产生歧义结构的原因等问题。

关 键 词:蒙古语 语料库 短语标注
文章编号:1005-8575(2006)05-0064-04
收稿时间:2006-01-15

A Phrase-tagging Research in Mongolian Corpus
Huashabao Dahurbayar. A Phrase-tagging Research in Mongolian Corpus[J]. , 2006, 33(5): 64-67
Authors:Huashabao Dahurbayar
Abstract:In this research project, the writer has tagged phrases in one million words-level modem Mongolian corpus and set up modem Mongolian basic phrase bank. The achievement provides a very necessary prerequisite for setting up Mongolian language semantic classification and the related description framework, local tests show the recall and the precision of tagging basic phrases in simple sentences reach 92. 93 % and 86. 79 %, we should do deep research on semantic information, grammatical information and ambiguous structure in Mongolian phrases
Keywords:Mongolian language   corpus    phrase-tagging
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号