首页 | 本学科首页   官方微博 | 高级检索  
     检索      

局部标准差优化的密度峰值聚类算法
引用本文:谢娟英,张文杰.局部标准差优化的密度峰值聚类算法[J].陕西师范大学学报,2024(3):47-62.
作者姓名:谢娟英  张文杰
作者单位:陕西师范大学计算机科学学院
基金项目:国家自然科学基金(62076159,61673251,12031010);;中央高校基本科研业务费(GK202105003);
摘    要:密度峰值聚类(clustering by fast search and find of density peaks, DPC)算法是一种基于密度的聚类算法,它可以发现任意形状和维度的类簇,是具有里程碑意义的聚类算法。然而,DPC算法的样本局部密度定义不适用于同时发现数据集的稠密簇和稀疏簇;此外,DPC算法的一步分配策略使得一旦有一个样本分配错误,将导致更多样本的错误分配,产生“多米诺骨牌效应”。针对这些问题,提出一种新的样本局部密度定义,采用局部标准差指数定义样本局部密度,克服DPC的密度定义缺陷;采用两步分配策略代替DPC的一步分配策略,克服DPC的“多米诺骨牌效应”,得到ESDTS-DPC算法。与DPC及其改进算法KNN-DPC、FKNN-DPC、DPC-CE和经典密度聚类算法DBSCAN的实验比较显示,提出的ESDTS-DPC算法具有更好的聚类准确性。

关 键 词:密度峰值聚类  标准差  局部密度  分配策略  聚类
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号