结合位置感知的命名实体识别方法 |
| |
作者姓名: | 王纪恬 陈艳平 黄蓉 黄瑞章 秦永彬 |
| |
作者单位: | 贵州大学文本计算与认知智能教育部工程研究中心, 贵州贵阳 550025;贵州大学公共大数据国家重点实验室, 贵州贵阳 550025;贵州大学计算机科学与技术学院, 贵州贵阳 550025 |
| |
基金项目: | 国家自然科学基金项目(62166007)和贵州省科技支撑计划项目(〔2022〕277)资助. |
| |
摘 要: | 命名实体识别(Named Entity Recognition,NER)的性能影响自然语言处理中诸多下游任务。跨度分类是命名实体识别常用的方法,由于其需要枚举每一个跨度,因此存在高复杂度和大量负实例问题。此外,对每个跨度的独立预测不仅忽略了词与词之间的依赖关系和位置信息,而且导致模型获取的语义信息较为单一,从而忽略了全局信息。针对上述问题,本文提出结合位置感知的命名实体识别方法。具体来说,首先使用位置编码增强词与词之间的位置特征,序列融合了绝对位置信息和相对位置信息,从而得到关注语序的语义信息,预测可能的实体边界;然后对候选实体边界进行匹配组合并过滤生成带有标签信息的候选实体实例;最后使用具有局部信息感知的标签注意力机制和多层感知机联合判断候选实体的标签。实验结果表明,本文提出模型在ACE2005、GENIA和CoNLL-2003数据集上的F1分数分别达到90.02%、81.33%和94.52%,该结果充分验证了所提模型在不同数据集上的有效性,进一步证明了其在命名实体识别任务中的优越性能。
|
关 键 词: | 命名实体识别 嵌套命名实体识别 边界检测 位置编码 神经网络 |
收稿时间: | 2023-08-31 |
修稿时间: | 2023-09-22 |
|
| 点击此处可从《广西科学》浏览原始摘要信息 |
|
点击此处可从《广西科学》下载全文 |
|