首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于样本重要性原理的KNN文本分类算法
引用本文:万韩永,左家莉,万剑怡,王明文.基于样本重要性原理的KNN文本分类算法[J].江西师范大学学报(自然科学版),2015(3):297-303,314.
作者姓名:万韩永  左家莉  万剑怡  王明文
作者单位:江西师范大学计算机信息工程学院,江西 南昌,330022
基金项目:国家自然科学基金(61272212,61163006,61203313,61365002,61462045)资助项目
摘    要:KNN是重要数据挖掘算法之一,具有良好的文本分类性能.传统的KNN方法对所有样本权重看作相同,而忽略了不同样本对于分类贡献的不同.为了解决该个问题,提出了一种样本重要性原理,并在此基础上构造KNN分类器.应用随机游走算法识别类边界点,并计算出每个样本点的边界值,生成每个样本点的重要性得分,将样本重要性与KNN方法融合形成一种新的分类模型——SI-KNN.在中英文文本语料上的实验表明:改进的SI-KNN分类模型相比于传统的KNN方法有一定的提高.

关 键 词:文本分类  KNN  样本重要性原理  SI-KNN

The KNN Text Classification Based on Sample Importance Principals
WAN Hanyong , ZUO Jiali , WAN Jianyi , WANG Mingwen.The KNN Text Classification Based on Sample Importance Principals[J].Journal of Jiangxi Normal University (Natural Sciences Edition),2015(3):297-303,314.
Authors:WAN Hanyong  ZUO Jiali  WAN Jianyi  WANG Mingwen
Institution:WAN Hanyong;ZUO Jiali;WAN Jianyi;WANG Mingwen;School of Computer Information Engineering,Jiangxi Normal University;
Abstract:
Keywords:text classification  KNN  sample importance principals  SI-KNN
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号