首页 | 本学科首页   官方微博 | 高级检索  
     检索      

适于长短文本分类的CBLGA和CBLCA混联模型
引用本文:王得强,吴军,王立平.适于长短文本分类的CBLGA和CBLCA混联模型[J].吉林大学学报(信息科学版),2021,39(5):553-561.
作者姓名:王得强  吴军  王立平
作者单位:清华大学机械工程系,北京100084
摘    要:为提高文本分类的准确性和效率,构建了一种基于Attention的CNN-BiLSTM/BiGRU(简称CBLGA)混联文本分类模型.首先通过并联不同卷积窗口大小的CNN(Convolutional Neural Networks)网络同时提取多种局部特征,之后将数据输入至BiLSTM和BiGRU并联组合模型中,利用BiLSTM和BiGRU组合提取了与文本中的上下文有密切关系的全局特征,最后对两个模型所得到的特征值进行了融合并在其中引入了注意力机制.构建基于Attention的CNN-BiLSTM/CNN(简称CBLCA)混联文本分类模型,特点是将CNN的输出分为两部分,其中一部分输入BiLSTM网络中,另一部分则直接和BiLSTM网络的输出进行融合,既保留了CNN提取的文字序列局部特征,又利用了BiLSTM网络提取出的全局特征.实验表明CBLGA模型和CBLCA模型在准确率和效率方面均实现了有效提升.最后,建立了一套针对不同长度的文本进行相应预处理和后续分类工作的分类的流程,使模型无论面对长文本还是短文本数据,均实现了同时提高文本分类的准确率和效率的目标.

关 键 词:CBLGA模型  CBLCA混联模型  注意力机制  混联模型  文本分类

CBLGA and CBLCA Hybrid Model for Long and Short Text's Classification
WANG Deqiang,WU Jun,WANG Liping.CBLGA and CBLCA Hybrid Model for Long and Short Text's Classification[J].Journal of Jilin University:Information Sci Ed,2021,39(5):553-561.
Authors:WANG Deqiang  WU Jun  WANG Liping
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号