基于K近邻和多类合并的密度峰值聚类算法 |
| |
作者姓名: | 薛小娜 高淑萍 彭弘铭 吴会会 |
| |
作者单位: | 西安电子科技大学数学与统计学院,西安,710071;西安电子科技大学通信工程学院,西安,710071 |
| |
基金项目: | 国家自然科学基金;国家科技重大专项;高等学校学科创新引智计划计划) |
| |
摘 要: | 针对密度峰值聚类(DPC)算法在处理结构复杂、 维数较高以及同类中存在多个密度峰值的数据集时聚类性能不佳的问题, 提出一种基于K近邻和多类合并的密度峰值聚类(KM-DPC)算法. 首先利用定义的密度计算方法描述样本分布, 采用新的评价指标获取聚类中心; 然后结合K近邻思想设计迭代分配策略, 将剩余点准确归类; 最后给出一种局部类合并方法, 以防将包含多个密度峰值点的类分裂. 仿真实验结果表明, 该算法在22个不同数据集上的性能明显优于DPC算法.
|
关 键 词: | 聚类 局部密度 密度峰值 K近邻 多类合并 |
收稿时间: | 2017-12-16 |
本文献已被 CNKI 万方数据 等数据库收录! |
| 点击此处可从《吉林大学学报(理学版)》浏览原始摘要信息 |
|
点击此处可从《吉林大学学报(理学版)》下载全文 |
|