首页 | 本学科首页   官方微博 | 高级检索  
     

基于注意力机制结合CNN-BiLSTM模型的电子病历文本分类
作者姓名:李超凡  马凯
作者单位:徐州医科大学医学信息与工程学院,徐州221004
基金项目:徐州市科技计划项目重点研发计划(KC21308);江苏省研究生教育教学改革研究与实践课题(JGZZ19_065);江苏省大学生创新创业项目(201810313047Y, 201910313004Z)
摘    要:为了解决中文电子病历文本分类的高维稀疏性、算法模型收敛速度较慢、分类效果不佳等问题,提出了一种基于注意力机制结合CNN-BiLSTM模型的病历文本分类模型。该模型首先使用word2vec工具进行词向量表示,利用多层卷积神经网络(convolutional neural networks, CNN)结构提取病历文本的局部特征,通过拼接操作丰富局部特征表示,再利用双向长短期记忆网络(bi-directional long short-term memory, BiLSTM)提取上下文的语义关联信息,获取句子级别的高层特征表达。最后通过Attention机制进行特征加权,降低噪声特征的影响,并输入softmax层进行分类。在多组对比实验的实验结果表明,该模型取得了97.85%的F1,有效地提升了文本分类的效果。

关 键 词:文本分类  卷积神经网络  双向长短期记忆神经网络  注意力机制
收稿时间:2021-07-05
修稿时间:2021-12-10
本文献已被 万方数据 等数据库收录!
点击此处可从《科学技术与工程》浏览原始摘要信息
点击此处可从《科学技术与工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号