基于标签语义信息感知的少样本命名实体识别方法 |
| |
作者姓名: | 张越 王长征 苏雪峰 闫智超 张广军 邵文远 李茹 |
| |
作者单位: | 山西大学计算机与信息技术学院,太原 030006;山西同方知网数字出版技术有限公司,太原 030032;山西大学计算机与信息技术学院,太原 030006;山西工程科技职业大学现代物流学院,晋中 030609;山西大学计算机与信息技术学院,太原 030006;山西大学计算智能与中文信息处理教育部重点实验室,太原 030006 |
| |
基金项目: | 山西省重点研发计划;山西省科技合作交流专项;山西省工程项目 |
| |
摘 要: | 在少样本命名实体识别方法中,目前广泛应用的方法是基于原型网络的两阶段模型。但是,该方法未充分利用实体标签中的语义信息,且在距离计算中过度依赖实体类型原型向量,导致模型泛化能力差。针对这些问题,提出一种基于标签语义信息感知的少样本命名实体识别方法。该方法是一种先进行实体跨度检测,再判断实体类型的两阶段方法。在构建实体类型原型向量时,将对应实体类型包含的语义信息考虑在内,通过维度转换层将其与原型向量相融合。在对新样本进行实体识别时,将实体类型的正负样本与实体类型原型向量组成实体类型三元组,依据样本到三元组的距离对其进行分类。在多个数据集上的实验结果证明,该模型的性能比以往的模型有较大的提升。
|
关 键 词: | 少样本命名实体识别 标签语义信息感知 实体类型三元组 原型网络 |
本文献已被 万方数据 等数据库收录! |
|