首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种多源领域自适应命名实体识别方法
引用本文:李佳芮,刘健,陈钰枫,徐金安,张玉洁.一种多源领域自适应命名实体识别方法[J].厦门大学学报(自然科学版),2022(4):617-623.
作者姓名:李佳芮  刘健  陈钰枫  徐金安  张玉洁
作者单位:北京交通大学计算机与信息技术学院
基金项目:国家自然科学基金(61976016,61976015,61876198);;国家重点研发计划(2019YFB1405200);
摘    要:领域自适应是解决低资源问题的一种通用方式,可应用于各种自然语言处理的任务中.当前针对命名实体识别(named entity recognition, NER)任务的领域自适应研究通常从单一的源领域迁移到目标领域,在目标领域和源领域相近的情况下,这种方式能够取得较好的识别效果,但是在目标领域与源领域相关度不高的情况下,单一领域迁移方式存在很大的局限性.针对这一问题,提出一种融合多源领域贡献度加权的自适应NER模型(multi-domain adaptation NER model based on importance weighting, MDAIW).1)通过多个领域的知识迁移来提升目标领域的实体识别性能;2)根据不同领域及其领域内样本对目标领域的重要性,计算领域贡献度;3)将领域贡献度引入到NER模型中,以此来实现更好的模型领域适应性.最终在多个目标领域上进行实验,性能皆优于当前性能最好的方法,验证了模型的有效性.

关 键 词:命名实体识别  领域自适应  贡献度加权  多源
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号