首页 | 本学科首页   官方微博 | 高级检索  
     

词典信息分层调整的中文命名实体识别方法
引用本文:李宝昌, 郭卫斌. 词典信息分层调整的中文命名实体识别方法[J]. 华东理工大学学报(自然科学版), 2023, 49(2): 276-283. DOI: 10.14135/j.cnki.1006-3080.20211105003
作者姓名:李宝昌  郭卫斌
作者单位:华东理工大学信息科学与工程学院, 上海200237
基金项目:国家自然科学基金(61672227,62076094);
摘    要:
在中文命名实体识别任务中,字信息融合词汇信息能丰富文本特征,但一个字可能对应多个候选词汇,容易产生词汇冲突,融合无关词汇信息会影响模型的识别效果,对此提出了词典信息分层调整的中文命名实体识别方法。首先将所有潜在词语按照词语长度进行分层,通过高层词语反馈调整低层词语的权重来保留更有用的信息,以此缓解语义偏差问题和降低词汇冲突影响;然后将词汇信息拼接到字信息来增强文本特征表示。
在Resume和Weibo数据集上的实验结果表明,本文方法与传统方法相比具有更优的效果。


关 键 词:词典信息  分层调整  字词融合  特征增强  中文命名实体识别
收稿时间:2021-11-05
点击此处可从《华东理工大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《华东理工大学学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号