首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于粗糙集的改进KNN文本分类算法
引用本文:苟和平.一种基于粗糙集的改进KNN文本分类算法[J].科学技术与工程,2012,12(20):4926-4929.
作者姓名:苟和平
作者单位:1. 琼台师范高等专科学校信息技术系,海口,571100
2. 西北师范大学数学与信息科学学院,兰州,730070
基金项目:教育部科学技术研究重点项目
摘    要:K最近邻算法(KNN)被认为是向量空间模型下最好的分类算法之一,在准确率和召回率方面比较出众,但随着样本数量的增加其相似度计算开销很大。本文提出一种改进算法RS-KNN,主要是利用粗糙集的相关理论,计算训练样本集中各样本子类的上近似空间和下近似空间,根据待分类文本出现在不同的近似空间,以缩减与待分类样本计算相似度的训练样本个数。实验表明此算法能够有效地降低分类计算开销。

关 键 词:K最近邻  文本分类  粗糙集  近似空间
收稿时间:4/12/2012 4:06:23 PM
修稿时间:4/12/2012 4:06:23 PM

An Improved KNN Text Categorization Algorithm Based on Rough Set
gouheping.An Improved KNN Text Categorization Algorithm Based on Rough Set[J].Science Technology and Engineering,2012,12(20):4926-4929.
Authors:gouheping
Abstract:KNN algorithm is efficient text categorization algorithm in recall and precision,but the computational overhead of text similarity is higher when the number of texts is larger. Aiming at the problem of the KNN ,this paper proposes an improved algorithm named RS-KNN based on rough set theory . According to the upper approximation space and lower approximation space of sample subsets , the algorithm can classify the part of texts driectly.Results of the experiment indicated the RS-KNN reduce computational overhead of text classification.
Keywords:KNN  text classification  rough set  approximation space
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《科学技术与工程》浏览原始摘要信息
点击此处可从《科学技术与工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号