首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于深度学习的中文文本特征提取与分类方法
引用本文:一种基于深度学习的中文文本特征提取与分类方法.一种基于深度学习的中文文本特征提取与分类方法[J].山东科学,2019,32(6):106-111.
作者姓名:一种基于深度学习的中文文本特征提取与分类方法
作者单位:1.山东大学,山东 济南 250100;2. 山东财源保障评价中心, 山东 济南 250001;3. 山东省电子政务大数据工程技术研究中心,山东 济南 250014;4. 齐鲁工业大学(山东省科学院) 山东省计算中心(国家超级计算济南中心) 山东省计算机网络重点实验室, 山东 济南 250014
基金项目:山东省重点研发计划(2018GGX101012)
摘    要:提出了一种基于卷积循环神经网络的文本特征提取方法,同时对比使用统计学中的TF-IDF以及Word2vec方法的文本特征表示,将提取的特征分别放入SVM与随机森林分类器中对来源于中国知网的中文学术论文数据集进行分类。实验结果表明,使用卷积神经网络和卷积循环神经网络特征提取模型提取的特征所取得的分类效果比TF-IDF、Word2vec特征提取方法得到的分类效果更好,同时使用SVM和随机森林分类器取得的分类效果略好于原生的神经网络。

关 键 词:卷积神经网络  卷积循环神经网络    特征提取  文本分类  
收稿时间:2019-08-28

A deep learning-based method for Chinese text-featureextraction and classification
CAO Lu-hui,DENG Yu-xiang,CHEN Tong,LI Zhao.A deep learning-based method for Chinese text-featureextraction and classification[J].Shandong Science,2019,32(6):106-111.
Authors:CAO Lu-hui  DENG Yu-xiang  CHEN Tong  LI Zhao
Institution:1. Shandong University, Jinan 250100, China;2. Shandong Financial Security and Evaluation Center,Jinan 250001, China;; 3. Big Data Engineering Technology Research Center of E-Government, Jinan 250014, China; 4. Shandong Provincial Key  Laboratory of Computer Networks,Shandong Computer Science Center(National Super Computer in Jinan), Qilu University of Technology(Shandong Academy of Sciences) , Jinan 250014, China;
Abstract:This paper proposes a text-feature extraction method based on a convolutional recurrent neural network, and in the meanwhile, it also compares the statistical methods TF-IDF and Word2vec for text-feature representation. Text features are then fed into the SVM and Random forest classifier to classify the Chinese academic papers from CNKI. Experimental results show that the classification results obtained from the feature extraction models based on the convolutional neural network and convolutional recurrent neural network are better than those obtained from the TF-IDF and Word2vec feature extraction methods. Furthermore, the classification results obtained from the SVM and Random forest classifier are slightly better than those obtained from the native neural network
Keywords:convolutional neural network  convolutional recurrent neural network  feature extraction  text classification  
本文献已被 CNKI 等数据库收录!
点击此处可从《山东科学》浏览原始摘要信息
点击此处可从《山东科学》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号