一种基于深度学习的中文文本特征提取与分类方法 |
| |
作者姓名: | 一种基于深度学习的中文文本特征提取与分类方法 |
| |
作者单位: | 1.山东大学,山东 济南 250100;2. 山东财源保障评价中心, 山东 济南 250001;3. 山东省电子政务大数据工程技术研究中心,山东 济南 250014;4. 齐鲁工业大学(山东省科学院) 山东省计算中心(国家超级计算济南中心) 山东省计算机网络重点实验室, 山东 济南 250014 |
| |
基金项目: | 山东省重点研发计划(2018GGX101012) |
| |
摘 要: | 提出了一种基于卷积循环神经网络的文本特征提取方法,同时对比使用统计学中的TF-IDF以及Word2vec方法的文本特征表示,将提取的特征分别放入SVM与随机森林分类器中对来源于中国知网的中文学术论文数据集进行分类。实验结果表明,使用卷积神经网络和卷积循环神经网络特征提取模型提取的特征所取得的分类效果比TF-IDF、Word2vec特征提取方法得到的分类效果更好,同时使用SVM和随机森林分类器取得的分类效果略好于原生的神经网络。
|
关 键 词: | 卷积神经网络 卷积循环神经网络 特征提取 文本分类 |
收稿时间: | 2019-08-28 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《山东科学》浏览原始摘要信息 |
|
点击此处可从《山东科学》下载全文 |
|