基于密度的改进聚类算法比较 |
| |
作者姓名: | 郭文娟 |
| |
作者单位: | 甘肃政法学院信息工程学院,甘肃兰州,730070 |
| |
基金项目: | 甘肃政法学院青年科研资助项目 |
| |
摘 要: | 针对传统K-means算法的聚类结果依赖初始聚类中心的缺陷,提出了一种基于密度的改进K-means聚类算法,该算法选择位于数据集样本密集区且相距较远的数据对象作为初始聚类中心,实现K-means聚类。针对PAM算法时间复杂度高,且不利于大数据集处理的缺陷,提出了一种基于密度的改进K-medoids聚类算法,在选取初始中心点时根据数据集样本的分布特征选取,使得初始中心点位于不同类簇。UCI机器学习数据库数据集和随机生成的带有噪音点的人工模拟数据集的实验测试证明,基于密度的改进K-means算法和基于密度的改进Kmedoids算法都具有很好的聚类效果,运行时间短,收敛速度快,有抗噪性能。
|
关 键 词: | 聚类 密度 K-means聚类算法 K-medoids聚类算法 |
本文献已被 CNKI 万方数据 等数据库收录! |
|