首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于孤立点自适应的K-means算法
引用本文:杨莉云,颜远海.基于孤立点自适应的K-means算法[J].河南科学,2019,37(4):507-513.
作者姓名:杨莉云  颜远海
作者单位:广东财经大学华商学院,广州,511300;广东财经大学华商学院,广州,511300
基金项目:广东省普通高校青年创新人才项目
摘    要:孤立点的存在使聚类中心的计算产生较大误差,影响K-means算法的聚类效果.针对该问题,引入谢林模型,使孤立点能够自动移动到其邻居所在位置,消除孤立点,同时,对K-means算法过程中的距离计算、初始聚类中心选取环节进行改进,提出基于孤立点自适应的K-means算法.该算法首先对原始数据进行归一化处理,以提高距离计算的准确性;然后,根据谢林模型的基本思想,将孤立点移动到其最近的多邻邻居;接着,由类簇的数目确定邻居样本的搜索范围,确定初始聚类中心;最后,根据移动后的数据集和初始聚类中心,进行K-means聚类.在UCI机器学习数据库中经典聚类数据集上的实验结果表明,该算法可显著提升聚类的精度,同时,簇的内聚性也比较好.

关 键 词:K-means算法  孤立点  谢林模型  初始聚类中心  误差平方和

K-means Algorithm Based on Outliers Adaptive
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号