基于多头注意力机制字词联合的中文命名实体识别 |
| |
引用本文: | 王进,王猛旗,张昕跃,孙开伟,朴昌浩.基于多头注意力机制字词联合的中文命名实体识别[J].江苏大学学报(自然科学版),2024(1):77-84. |
| |
作者姓名: | 王进 王猛旗 张昕跃 孙开伟 朴昌浩 |
| |
作者单位: | 重庆邮电大学数据工程与可视计算重点实验室 |
| |
基金项目: | 国家自然科学基金资助项目(61806033); |
| |
摘 要: | 针对现有基于字词联合的中文命名实体识别方法会引入冗余词汇干扰、模型网络结构复杂、难以迁移的问题,提出一种基于多头注意力机制字词联合的中文命名实体识别算法.算法采用多头注意力机制融合词汇边界信息,并通过分类融合BIE词集降低冗余词汇干扰.建立了多头注意力字词联合模型,包含字词匹配、多头注意力、融合等模块.与现有中文命名实体识别方法相比,本算法避免了设计复杂的序列模型,方便与现有基于字的中文命名实体识别模型结合.采用召回率、精确率以及F1值作为评价指标,通过消融试验验证模型各个部分的效果.结果表明,本算法在MSRA和Weibo数据集上F1值分别提升0.28、0.69,在Resume数据集上精确率提升0.07.
|
关 键 词: | 中文命名实体识别 词汇冗余 词汇边界信息 字词联合 多头注意力机制 BIE词集 |
|
|