基于密度万有引力改进的引力峰值聚类算法 |
| |
引用本文: | 陈金鹏,安俊秀,李睿熙.基于密度万有引力改进的引力峰值聚类算法[J].山西大学学报(自然科学版),2023(5):1064-1075. |
| |
作者姓名: | 陈金鹏 安俊秀 李睿熙 |
| |
作者单位: | 1. 成都信息工程大学并行计算实验室;2. 成都锦城学院计算机与软件学院 |
| |
基金项目: | 国家社会科学基金(22BXW048); |
| |
摘 要: | 针对密度峰值聚类算法(DPC)中存在的截断距离难以确定、局部密度定义单一的问题,本文提出了一种基于密度万有引力改进的引力峰值聚类算法(DG-DPC算法)。该算法使用相互K近邻的方法对相似性度量和局部密度进行了重新定义,然后将引力参数引入到DPC算法中,并通过新的相对局部密度与引力参数的倒数作出决策图选取簇中心,对数据集中的点进行分配。仿真实验表明,DG-DPC算法对于人工合成数据集和UCI数据集都有效,且准确率相对于基于相对密度优化的密度峰值聚类算法(RE-DPC算法)、DPC算法、基于间隙自动中心检测的密度峰值聚类算法(GAP-DPC算法)分别平均提高了31.07%、21.60%、17.20%。
|
关 键 词: | 聚类 万有引力 相互K近邻 相似性度量 相对局部密度 相对引力参数 |
|
|