多特征中文命名实体识别 |
| |
作者姓名: | 胥小波 王涛 康睿 周刚 李天宁 |
| |
作者单位: | 中国电子科技网络信息安全有限公司,成都610041;四川省科学技术信息研究所,成都610016;四川大学计算机学院,成都610065 |
| |
基金项目: | 国家自然科学基金(62137001, JG2020125) |
| |
摘 要: | 命名实体识别任务是对文本中的实体进行定位,并将其分类至预定义的类别中.目前主流的中文命名实体识别的模型是基于字符的命名实体识别模型.该模型在使用句法特征之前,需先进行分词,不能很好的引入句子的句法信息.另外,基于字符的模型没有利用词典中的先验词典信息,以及中文偏旁部首蕴含的象形信息.针对上述问题,论文提出了融合句法和多粒度语义信息的多特征中文命名实体识别模型.实验证明论文模型相对目前主流模型有了较大的提高,同时论文还通过实验分析了各种特征对模型识别效果的影响.
|
关 键 词: | 命名实体识别 中文 多特征 自然语言处理 |
收稿时间: | 2021-11-15 |
修稿时间: | 2021-12-07 |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《四川大学学报(自然科学版)》浏览原始摘要信息 |
|
点击此处可从《四川大学学报(自然科学版)》下载免费的PDF全文 |
|