首页 | 本学科首页   官方微博 | 高级检索  
     

基于标签语义信息感知的少样本命名实体识别方法
作者姓名:张越  王长征  苏雪峰  闫智超  张广军  邵文远  李茹
作者单位:山西大学计算机与信息技术学院,太原 030006;山西同方知网数字出版技术有限公司,太原 030032;山西大学计算机与信息技术学院,太原 030006;山西工程科技职业大学现代物流学院,晋中 030609;山西大学计算机与信息技术学院,太原 030006;山西大学计算智能与中文信息处理教育部重点实验室,太原 030006
基金项目:山西省重点研发计划;山西省科技合作交流专项;山西省工程项目
摘    要:在少样本命名实体识别方法中,目前广泛应用的方法是基于原型网络的两阶段模型。但是,该方法未充分利用实体标签中的语义信息,且在距离计算中过度依赖实体类型原型向量,导致模型泛化能力差。针对这些问题,提出一种基于标签语义信息感知的少样本命名实体识别方法。该方法是一种先进行实体跨度检测,再判断实体类型的两阶段方法。在构建实体类型原型向量时,将对应实体类型包含的语义信息考虑在内,通过维度转换层将其与原型向量相融合。在对新样本进行实体识别时,将实体类型的正负样本与实体类型原型向量组成实体类型三元组,依据样本到三元组的距离对其进行分类。在多个数据集上的实验结果证明,该模型的性能比以往的模型有较大的提升。

关 键 词:少样本命名实体识别  标签语义信息感知  实体类型三元组  原型网络  
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号