跨度语义增强的命名实体识别方法 |
| |
引用本文: | 耿汝山,陈艳平,唐瑞雪,黄瑞章,秦永彬,董博.跨度语义增强的命名实体识别方法[J].西安交通大学学报,2022(7):118-126. |
| |
作者姓名: | 耿汝山 陈艳平 唐瑞雪 黄瑞章 秦永彬 董博 |
| |
作者单位: | 1. 公共大数据国家重点实验室;2. 贵州大学计算机科学与技术学院;3. 西安交通大学计算机科学与技术学院 |
| |
基金项目: | 国家自然科学基金资助项目(62166007); |
| |
摘 要: | 针对命名实体识别方法存在字与字之间语义信息丢失、模型召回率不佳等问题,提出了一种跨度语义信息增强的命名实体识别方法。首先,使用ALBERT预训练语言模型提取文本中包含上下文信息的字符向量,并使用GloVe模型生成字符向量;其次,将两种向量进行拼接作为模型输入向量,对输入向量进行枚举拼接形成跨度信息矩阵;然后,使用多维循环神经网络和注意力网络对跨度信息矩阵进行运算,增强跨度之间的语义联系;最后,将跨度信息增强后的矩阵进行跨度分类以识别命名实体。实验表明:与传统的跨度方法相比该方法能够有效增强跨度之间的语义依赖特征,从而提升命名实体识别的召回率;该方法在ACE2005英文数据集上比传统的方法召回率提高了0.42%,并且取得了最高的F1值。
|
关 键 词: | 命名实体识别 跨度语义增强 多维循环神经网络 ALBERT预训练语言模型 |
|
|