首页 | 本学科首页   官方微博 | 高级检索  
     

基于多头注意力机制的医学文本实体研究
作者姓名:沈同平  俞磊  束建华  方芳  王元茂
作者单位:安徽中医药大学医药信息工程学院
基金项目:安徽省质量工程项目(2017mooc223,2020jyxm1018,2020jyxm1029);;安徽省高校自然科学研究重点项目(KJ2020A0443);
摘    要:医学文本实体识别过程存在多义性和复杂性等特点,这导致传统的语言处理模型无法有效获取医学文本语义信息,从而影响了医学实体识别效果。本文提出了一种基于全词MASK的医学文本实体识别模型,其能有效处理中文文本。其中,BERT预处理层能够生成表征上下文语义信息的词向量,Bi-LSTM层对输入的词向量进行双向特征信息提取,注意力机制层对输出的特征向量进行权重分配,从而有效获取文本语句中的长距离依赖,最后通过CRF解码以生成实体标签序列。实验结果表明,该模型在中文简历语料库和CCKS2017语料库中表现优异,F1值分别为96.14%和92.68%。

关 键 词:命名实体识别  深度学习  多头注意力  BERT
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号