融合SikuBERT模型与MHA的古汉语命名实体识别 |
| |
作者姓名: | 陈雪松 詹子依 王浩畅 |
| |
作者单位: | 1. 东北石油大学电气信息工程学院;2. 东北石油大学计算机与信息技术学院 |
| |
摘 要: | 针对传统的命名实体识别方法无法充分学习古汉语复杂的句子结构信息以及在长序列特征提取过程中容易带来信息损失的问题,提出一种融合SikuBERT(Siku Bidirectional Encoder Representation from Transformers)模型与MHA(Multi-Head Attention)的古汉语命名实体识别方法。首先,利用SikuBERT模型对古汉语语料进行预训练,将训练得到的信息向量输入BiLSTM(Bidirectional Long Short-Term Memory)网络中提取特征,再将BiLSTM层的输出特征通过MHA分配不同的权重减少长序列的信息损失,最后通过CRF(Conditional Random Field)解码得到预测的序列标签。实验表明,与常用的BiLSTM-CRF、 BERT-BiLSTM-CRF等模型相比,该方法的F1值有显著提升,证明了该方法能有效提升古汉语命名实体识别的效果。
|
关 键 词: | 古汉语 命名实体识别 SikuBERT模型 多头注意力机制 |
|