基于RoBERTa和多头注意力的简历命名实体识别方法 |
| |
引用本文: | 张玉杰,李劲华,赵俊莉.基于RoBERTa和多头注意力的简历命名实体识别方法[J].青岛大学学报(自然科学版),2023(1):22-27. |
| |
作者姓名: | 张玉杰 李劲华 赵俊莉 |
| |
作者单位: | 青岛大学计算机科学技术学院 |
| |
基金项目: | 国家自然科学基金(批准号:62172247)资助; |
| |
摘 要: | 针对传统简历实体识别存在一词多义和训练时间长的问题,提出了一种新的简历命名实体识别模型。通过RoBERTa预训练模型获取具有上下文关系的字向量,结合BiGRU和多头注意力机制(Multi-head Attention, MHA)层提取全局信息和局部相关性信息,采用CRF层修正解码确定最终标签,同时裁剪RoBERTa预训练模型。实验表明,该模型在中文电子简历数据集取得95.97%的F1值,高于其他主流模型,且相较于未剪枝的模型提升0.43%,减少1/5训练时间。
|
关 键 词: | 命名实体识别 RoBERTa预训练模型 多头注意力机制 条件随机场 |
|
|