基于样本重要性原理的KNN文本分类算法 The KNN Text Classification Based on Sample Importance Principals期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于样本重要性原理的KNN文本分类算法

引用本文：	万韩永,左家莉,万剑怡,王明文.基于样本重要性原理的KNN文本分类算法[J].江西师范大学学报(自然科学版),2015(3):297-303,314.

作者姓名：	万韩永左家莉万剑怡王明文

作者单位：	江西师范大学计算机信息工程学院,江西南昌,330022

基金项目：	国家自然科学基金(61272212,61163006,61203313,61365002,61462045)资助项目

摘要：	KNN是重要数据挖掘算法之一,具有良好的文本分类性能.传统的KNN方法对所有样本权重看作相同,而忽略了不同样本对于分类贡献的不同.为了解决该个问题,提出了一种样本重要性原理,并在此基础上构造KNN分类器.应用随机游走算法识别类边界点,并计算出每个样本点的边界值,生成每个样本点的重要性得分,将样本重要性与KNN方法融合形成一种新的分类模型——SI-KNN.在中英文文本语料上的实验表明:改进的SI-KNN分类模型相比于传统的KNN方法有一定的提高.
关键词：	文本分类 KNN 样本重要性原理 SI-KNN
The KNN Text Classification Based on Sample Importance Principals

WAN Hanyong , ZUO Jiali , WAN Jianyi , WANG Mingwen.The KNN Text Classification Based on Sample Importance Principals[J].Journal of Jiangxi Normal University (Natural Sciences Edition),2015(3):297-303,314.

Authors:	WAN Hanyong ZUO Jiali WAN Jianyi WANG Mingwen

Institution:	WAN Hanyong;ZUO Jiali;WAN Jianyi;WANG Mingwen;School of Computer Information Engineering,Jiangxi Normal University;

Abstract:

Keywords:	text classification KNN sample importance principals SI-KNN
本文献已被 CNKI 万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏