融合领域词向量的实体识别研究 |
| |
引用本文: | 侯敏,高茂,张丽萍,闫盛,赵宇博.融合领域词向量的实体识别研究[J].内蒙古师范大学学报(自然科学版),2024(2):197-206. |
| |
作者姓名: | 侯敏 高茂 张丽萍 闫盛 赵宇博 |
| |
作者单位: | 内蒙古师范大学计算机科学技术学院 |
| |
摘 要: | 以字为切分单位的BERT预训练模型在实体识别任务中表现优异,但其忽略粗粒度的领域词汇作为整体的语义表示信息,对于教育领域课程文本中存在大量嵌套实体的识别效果不佳。针对上述问题,提出动态融合字、词级别词向量的LEBERT-CRF教育领域课程文本实体识别方法,利用词典适配器将领域词典特征高效融入BERT模型中,以提升BERT模型对实体词边界的识别效果,更好地适应课程知识抽取任务。结果表明,LEBERT-CRF模型相较其他主流的实体识别模型表现更好,F1达到95.47%。
|
关 键 词: | 实体识别 LEBERT 领域词向量 字词融合 |
|
|