基于孤立点自适应的K-means算法 K-means Algorithm Based on Outliers Adaptive期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于孤立点自适应的K-means算法

引用本文：	杨莉云,颜远海.基于孤立点自适应的K-means算法[J].河南科学,2019,37(4):507-513.

作者姓名：	杨莉云颜远海

作者单位：	广东财经大学华商学院,广州,511300;广东财经大学华商学院,广州,511300

基金项目：	广东省普通高校青年创新人才项目

摘要：	孤立点的存在使聚类中心的计算产生较大误差,影响K-means算法的聚类效果.针对该问题,引入谢林模型,使孤立点能够自动移动到其邻居所在位置,消除孤立点,同时,对K-means算法过程中的距离计算、初始聚类中心选取环节进行改进,提出基于孤立点自适应的K-means算法.该算法首先对原始数据进行归一化处理,以提高距离计算的准确性;然后,根据谢林模型的基本思想,将孤立点移动到其最近的多邻邻居;接着,由类簇的数目确定邻居样本的搜索范围,确定初始聚类中心;最后,根据移动后的数据集和初始聚类中心,进行K-means聚类.在UCI机器学习数据库中经典聚类数据集上的实验结果表明,该算法可显著提升聚类的精度,同时,簇的内聚性也比较好.
关键词：	K-means算法孤立点谢林模型初始聚类中心误差平方和
K-means Algorithm Based on Outliers Adaptive

Abstract:

Keywords:
本文献已被 CNKI 万方数据等数据库收录！