首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于粗糙集理论和BP神经网络的文本自动分类方法研究
引用本文:白如江,王效岳.基于粗糙集理论和BP神经网络的文本自动分类方法研究[J].山东大学学报(理学版),2006,41(3):70-75.
作者姓名:白如江  王效岳
作者单位:山东理工大学,图书馆,山东,淄博,255049
摘    要:结合粗糙集的属性约简和神经网络的分类机理,提出了一种混合算法. 首先应用粗糙集理论的属性约简作为预处理器,把冗余的属性从决策表中删去,然后运用神经网络进行分类. 这样可以大大降低向量维数,克服粗糙集对于决策表噪声比较敏感的缺点. 试验结果表明,与朴素贝叶斯、SVM、kNN传统分类方法相比,该方法在保持分类精度的基础上,分类速度有明显的提高,体现出较好的稳定性和容错性,尤其适用于特征向量多且难以分类的文本.

关 键 词:文本分类  粗糙集  神经网络  属性约简  VSM
文章编号:1671-9352(2006)03-0079-06
收稿时间:2006-03-28
修稿时间:2006年3月28日

AA hybrid classifier based on the rough sets and BPneural networks
BAI Ru-jiang,WANG Xiao-yue.AA hybrid classifier based on the rough sets and BPneural networks[J].Journal of Shandong University,2006,41(3):70-75.
Authors:BAI Ru-jiang  WANG Xiao-yue
Institution:The Library of Shandong University of Technology, Zibo 255049, Shandong, China
Abstract:A hybrid classifier is presented based on the combination of rough set theory and BP neural network. Firstly, the documents are denoted by vector space model. Secondly it reduced the feature vector by using vough sets. Finally classed the documents by BP neural network. Experimental results show that the algorithm Rough-ANN is effective for the texts classification, and has the better performance in classification precision, stability and fanh-tolerance when compared with the traditional classification methods, Bayesian classifiers SVM and kNN, especially for the complex classification problems with many feature vectors.
Keywords:VSM
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《山东大学学报(理学版)》浏览原始摘要信息
点击此处可从《山东大学学报(理学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号