基于多头注意力机制的医学文本实体研究 |
| |
作者姓名: | 沈同平 俞磊 束建华 方芳 王元茂 |
| |
作者单位: | 安徽中医药大学医药信息工程学院 |
| |
基金项目: | 安徽省质量工程项目(2017mooc223,2020jyxm1018,2020jyxm1029);;安徽省高校自然科学研究重点项目(KJ2020A0443); |
| |
摘 要: | 医学文本实体识别过程存在多义性和复杂性等特点,这导致传统的语言处理模型无法有效获取医学文本语义信息,从而影响了医学实体识别效果。本文提出了一种基于全词MASK的医学文本实体识别模型,其能有效处理中文文本。其中,BERT预处理层能够生成表征上下文语义信息的词向量,Bi-LSTM层对输入的词向量进行双向特征信息提取,注意力机制层对输出的特征向量进行权重分配,从而有效获取文本语句中的长距离依赖,最后通过CRF解码以生成实体标签序列。实验结果表明,该模型在中文简历语料库和CCKS2017语料库中表现优异,F1值分别为96.14%和92.68%。
|
关 键 词: | 命名实体识别 深度学习 多头注意力 BERT |
|
|