基于孤立点自适应的K-means算法 |
| |
引用本文: | 杨莉云,颜远海.基于孤立点自适应的K-means算法[J].河南科学,2019,37(4):507-513. |
| |
作者姓名: | 杨莉云 颜远海 |
| |
作者单位: | 广东财经大学华商学院,广州,511300;广东财经大学华商学院,广州,511300 |
| |
基金项目: | 广东省普通高校青年创新人才项目 |
| |
摘 要: | 孤立点的存在使聚类中心的计算产生较大误差,影响K-means算法的聚类效果.针对该问题,引入谢林模型,使孤立点能够自动移动到其邻居所在位置,消除孤立点,同时,对K-means算法过程中的距离计算、初始聚类中心选取环节进行改进,提出基于孤立点自适应的K-means算法.该算法首先对原始数据进行归一化处理,以提高距离计算的准确性;然后,根据谢林模型的基本思想,将孤立点移动到其最近的多邻邻居;接着,由类簇的数目确定邻居样本的搜索范围,确定初始聚类中心;最后,根据移动后的数据集和初始聚类中心,进行K-means聚类.在UCI机器学习数据库中经典聚类数据集上的实验结果表明,该算法可显著提升聚类的精度,同时,簇的内聚性也比较好.
|
关 键 词: | K-means算法 孤立点 谢林模型 初始聚类中心 误差平方和 |
K-means Algorithm Based on Outliers Adaptive |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 CNKI 万方数据 等数据库收录! |
|