中文词语内部层次结构标注语料库的建立 |
| |
作者姓名: | 林倩 文华婷 杨静 刘鑫 林欢 王鸿吉 苏劲松 |
| |
作者单位: | 厦门大学信息学院 |
| |
基金项目: | 国家重点研发计划(2019QY1803);;国家自然科学基金(61672440);;国家语委一般项目(YB135-49); |
| |
摘 要: | 针对现有中文自然语言处理研究多以词或者字符为单位,忽视了中文词的内部层次结构的问题,提出一种新的中文词内部层次结构定义标准.该标准定义了内部结构的节点类型和节点内部关系.在此基础上,进一步提出了中文词内部层次结构的标注规范,并且人工标注了含有带内部层次结构的53 918个中文词的词料库.该研究有望为后续的细粒度中文自然语言处理提供新思路.
|
关 键 词: | 中文自然语言处理 标注规范 语料库 |
本文献已被 CNKI 等数据库收录! |
|