首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于离群点检测的K-means算法
引用本文:冷泳林,张清辰,赵 亮,鲁富宇.基于离群点检测的K-means算法[J].渤海大学学报(自然科学版),2014(1):34-38,48.
作者姓名:冷泳林  张清辰  赵 亮  鲁富宇
作者单位:渤海大学高职学院;大连理工大学软件学院;
基金项目:辽宁省科技厅项目(No:2013020014);中国高等职业技术教育研究会规划课题(No:GZYLX2011211);辽宁省教育科学“二五”规划(No:JG12DB211)
摘    要:K-means算法以其简单、快速的特点在现实生活中得到广泛应用.然而传统Kmeans算法容易受到噪声的影响,导致聚类结果不稳定,聚类精度不高.针对这个问题,提出一种基于离群点检测的K-means算法,首先检测出数据集中的离群点,在选择初始种子的时候,避免选择离群点作为初始种子.然后在对非离群点进行聚类完成后,根据离群点到各个聚类的距离,将离群点划分到相应的聚类中.算法有效降低离群点对K-means算法的影响,提高聚类结果的准确率.实验表明,在聚类类别数给定的前提下,在标准数据集UCI上该算法有效降低离群点对K-means算法的影响,提高了聚类的精确率和稳定性.

关 键 词:聚类  K-means算法  离群点  UCI数据集
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号