首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于粗糙KNN算法的文本分类方法
引用本文:王渊,刘业政,姜元春.基于粗糙KNN算法的文本分类方法[J].合肥工业大学学报(自然科学版),2014(12):1513-1517.
作者姓名:王渊  刘业政  姜元春
作者单位:合肥工业大学 管理学院,安徽 合肥,230009
基金项目:国家自然科学基金资助项目
摘    要:在文本分类中,数据规模过大或文本分布不均匀对传统KNN算法的准确率和效率具有重要影响。为了解决该问题,文章提出一种基于粗糙KNN(k-nearest neighbor)算法的文本分类新方法。首先引入粗糙集中的上下近似概念定义各类文本的上下近似空间,将文本向量空间分为核心和混合2大区域;然后改进传统KNN算法的隶属度函数;再针对不同的文本区域,采取差异化的分类策略以提高分类的效率和准确率。实验表明,基于粗糙KNN算法的文本分类方法在提高分类准确率的同时,分类的效率也有很大提高。

关 键 词:文本分类  粗糙集  KNN算法  核心区域  混合区域

Method of text classification based on rough k-nearest neighbor algorithm
WANG Yuan,LIU Ye-zheng,JIANG Yuan-chun.Method of text classification based on rough k-nearest neighbor algorithm[J].Journal of Hefei University of Technology(Natural Science),2014(12):1513-1517.
Authors:WANG Yuan  LIU Ye-zheng  JIANG Yuan-chun
Institution:WANG Yuan;LIU Ye-zheng;JIANG Yuan-chun;School of Management,Hefei University of Technology;
Abstract:
Keywords:text classification  rough set  k-nearest neighbor (KNN ) algorithm  core region  hybrid region
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号