融合实体信息的图卷积神经网络的短文本分类模型 |
| |
作者姓名: | 王佳宇 李楹 马春梅 吴东昊 姜丽芬 |
| |
作者单位: | 天津师范大学计算机与信息工程学院 |
| |
基金项目: | 国家自然科学基金资助项目(61902282);;天津市自然科学基金重点项目(18JCYBJC8900,18JCQNJC70200,20JCZDJC000);;天津市教委科研计划资助项目(2018KJ155);;天津市科技发展基金资助项目(JW1702);;广东省科技计划资助项目(2017KQNCX194); |
| |
摘 要: | 提出一种融合实体信息的图卷积神经网络模型(ETGCN),用于短文本分类.首先,使用实体链接工具抽取短文本中的实体;然后,利用图卷积神经网络对文档、实体和单词进行建模,丰富文本的潜在语义特征;将学习到的单词节点表示与BERT词嵌入进行拼接,通过双向长短期记忆网络,进一步挖掘文本上下文语义特征,再与图神经网络模型得到的文本特征进行融合,用于分类.实验结果表明,该模型在数据集AGNews、R52和MR上的分类准确率分别为88.38%、93.87%和82.87%,优于大部分主流的基线方法.
|
关 键 词: | 短文本分类 实体信息 图卷积神经网络 |
|
|