首页 | 本学科首页   官方微博 | 高级检索  
     

中文词语内部层次结构标注语料库的建立
作者姓名:林倩  文华婷  杨静  刘鑫  林欢  王鸿吉  苏劲松
作者单位:厦门大学信息学院
基金项目:国家重点研发计划(2019QY1803);;国家自然科学基金(61672440);;国家语委一般项目(YB135-49);
摘    要:
针对现有中文自然语言处理研究多以词或者字符为单位,忽视了中文词的内部层次结构的问题,提出一种新的中文词内部层次结构定义标准.该标准定义了内部结构的节点类型和节点内部关系.在此基础上,进一步提出了中文词内部层次结构的标注规范,并且人工标注了含有带内部层次结构的53 918个中文词的词料库.该研究有望为后续的细粒度中文自然语言处理提供新思路.

关 键 词:中文自然语言处理  标注规范  语料库
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号