共查询到20条相似文献,搜索用时 62 毫秒
1.
密度峰值聚类(Clustering by Fast Search and Find of Density Peaks, DPC)算法是一种新型的基于密度的聚类算法,通过选取自身密度高且距离其他更高密度点较远的样本点作为聚类中心,再根据样本间的局部密度和距离进行聚类。一方面,虽然DPC算法参数唯一、简单、高效,但是其截断距离的取值是按经验策略设定,而截断距离值选取不当会导致局部密度和距离计算错误;另一方面,聚类中心的选取采用人机交互模式,对聚类结果的主观影响较大。针对DPC算法的这些缺陷,目前的改进方向主要有3个:改进截断距离的取值方式、改进局部密度和距离的计算方式以及改进聚类中心的选取方式。通过这3个方向的改进,使得DPC过程自适应。本文对DPC算法的自适应密度峰值聚类算法的研究现状进行比较分析,对进一步的工作进行展望并给出今后的研究方向:将DPC算法与智能算法有机结合实现算法自适应,对于算法处理高维数据集的性能也需要进一步探索。 相似文献
2.
针对密度峰值聚类算法(DPC)中存在的截断距离难以确定、局部密度定义单一的问题,本文提出了一种基于密度万有引力改进的引力峰值聚类算法(DG-DPC算法)。该算法使用相互K近邻的方法对相似性度量和局部密度进行了重新定义,然后将引力参数引入到DPC算法中,并通过新的相对局部密度与引力参数的倒数作出决策图选取簇中心,对数据集中的点进行分配。仿真实验表明,DG-DPC算法对于人工合成数据集和UCI数据集都有效,且准确率相对于基于相对密度优化的密度峰值聚类算法(RE-DPC算法)、DPC算法、基于间隙自动中心检测的密度峰值聚类算法(GAP-DPC算法)分别平均提高了31.07%、21.60%、17.20%。 相似文献
3.
针对密度峰值聚类(density peak clustering, DPC)算法不能根据数据集自适应选取聚类中心和截断距离dc,从而不能自适应聚类的问题,提出了一种自适应的密度峰值聚类(adaptive density peak clustering, ADPC)算法.首先,提出了一个综合考虑局部密度ρi和相对距离δi的参数μi,根据μi的排列顺序及下降趋势trend自动确定聚类中心.然后,基于基尼系数G对截断距离dc做了自适应选择.最后,对ADPC算法做出了实验验证,并与DPC算法和K-means算法进行了对比.实验结果表明,ADPC算法具有较高的ARI,NMI和AC值,具有较好的聚类效果. 相似文献
4.
【目的】针对基于密度峰值聚类的自训练算法中错误标记样本会造成分类正确率降低,以及当已标记样本分散时密度峰值聚类算法结果易受到截断距离影响的问题,提出了结合合成实例与adaboostENN的密度峰值自训练算法。【方法】首先,用合成实例方法增加已标记样本的数量并提升空间分布的可靠性;其次,通过密度峰值聚类算法揭示数据空间结构,从而选择有代表性的无标记样本进行标记预测;最后,用集成噪声滤波器来更准确地检测出被错误标记的样本并将它删除。【结果】通过12个UCI数据集上的实验验证了所提出算法的有效性。【结论】提出的算法不仅能有效地解决无标记样本被错误标记的问题,而且使得密度峰值聚类算法不易受到截断距离的影响。 相似文献
5.
在医学图像分割研究中,针对密度峰值聚类算法(density peaks clustering algorithm,DPC),依靠先验知识给定截断距离d_c且人工选择聚类中心点具有主观随意性等缺陷,提出了一种结合蚁群算法选取密度峰值聚类最优参数的医学图像分割方法.该算法首先利用蚁群算法全局性和鲁棒性的优点,使用图像熵计算信息素来指导蚁群的搜索路径;再使用变量量化表示聚类中心个数,蚁群通过迭代选择最优截断距离d_c和聚类中心,实现了DPC算法的自适应分割并得到了较好的分割效果.仿真实验分析证明了算法的有效性和实用性. 相似文献
6.
为解决传统 K-means 算法中因初始聚类中心选择不当而导致聚类结果陷入局部极值的问题, 采用蝙蝠算法搜寻 K-means 算法的初始聚类中心, 并将模拟退火的思想和基于排挤的小生境技术引入到蝙蝠算法中, 以克服原始蝙蝠算法存在后期收敛速度慢、 搜索力不强等问题。 同时, 通过测试函数验证了其有效性。 最后利用改进后的蝙蝠算法优化 K-means 算法的初始聚类中心, 并将该改进的算法与传统的 K-means 算法的聚类结果进行了对比。 实验结果表明, 改进后的算法的聚类性能比传统的 K-means 算法有很大提高。 相似文献
7.
对密度峰值聚类算法进行有效改进,计算各样本点之间的距离和各样本点局部密度,选择两者中较大的样本点作为聚类中心点,根据其余样本点与各中心点的距离设定样本点所属类别;引入K近邻算法对密度峰值聚类算法进行优化,求解各样本点的距离时只需要考虑其周围由邻近值决定的若干样本点,实现距离阈值的自动选取;根据距离矩阵计算样本点的密度,绘制决策图并选择簇内中心点,将剩余点根据密度值分配给离中心点距离最近的类;最后将K近邻-密度峰值聚类算法部署至Hadoop云计算平台,用于解决大规模数据聚类的问题。仿真结果表明,通过合理设置K近邻算法的近邻值k,K近邻-密度峰值聚类算法具有较好的大数据样本聚类性能,与常用聚类算法相比,该算法具有更高的聚类准确率和聚类效率,适用于大数据样本聚类。 相似文献
8.
陈羽 《伊犁师范学院学报(自然科学版)》2023,(1):56-65
密度峰值聚类算法(DPC)具有准确率高、自动检测类别个数、识别中心点数目等优良性质.由于DPC算法用欧氏距离度量样本点之间的邻近关系,导致无法有效地提取高维复杂数据中的流形结构信息.针对密度峰值聚类算法的这个瑕疵,考虑到数据点之间的几何特性和流形结构,以测地距离替代欧氏距离,设计了一种改进的密度峰值聚类算法.数值模拟结果显示,改进的密度峰值聚类算法能够有效地处理具有流形分布特征的数据聚类问题. 相似文献
9.
《山东大学学报(理学版)》2016,(1)
提出一种基于密度峰值发现的文本聚类算法,将文本的距离与密度计算转化为文本向量的相似度计算,实现基于密度峰值发现的文本聚类算法。该算法采用空间向量模型表示文本,用余弦公式进行相似度计算,然后求得每个文本的密度和距离。剔除噪音点后,选取聚类中心,将剩下的非中心点划分到距离其最近的聚类中心所在的类簇中去。通过多组对比试验,验证了本方法的可靠性和鲁棒性。 相似文献
10.
《南京大学学报(自然科学版)》2017,(4)
相对于其他的密度聚类算法,密度峰值聚类(Density Peaks Clustering,DPC)算法思想简洁新颖,所需参数少,不需要进行迭代求解,而且具有可扩展性.但是,DPC仍然具有一定缺陷,例如存在截断阈值dc的定义模糊以及选取中心点失效等问题.在阐述了DPC的算法思想和原理的基础上,分析了DPC算法的缺陷,然后从多个改进的角度对其相关研究工作进行了综述.通过分析DPC与相关理论(数据场、图论、粒计算等)的联系,针对密度峰值的缺点,提出了基于粒计算的DPC算法改进框架,其中包括由细到粗、由细到粗和双向变粒度这三种机制以及基于网格粒化的密度峰值算法框架.最后对DPC今后的研究工作进行了展望,包括动态密度峰值聚类、利用密度峰值研究网络拓扑、处理复杂任务以及改进其他聚类等,希望为DPC的进一步研究提供新思想. 相似文献
11.
牛向阳 《阜阳师范学院学报(自然科学版)》2015,32(1):13-15
研究PCA算法、GA和BP算法的机理,分析三种算法的优缺点,结合PCA算法降维优点及GA全局寻优与BP算法快速收敛的特点,将主成分进行实数编码,将网络结构进行二进制编码,并在遗传操作中嵌入BP算子,将三种算法进行耦合,提出一种新的混合算法,就财政能力综合评价问题进行实验,实验结果表明混合算法明显优于GA和BP算法。 相似文献
12.
增量算法是平面投影法中一种常用的点云剖分算法,该算法编程简单,占用内存少,计算速度较慢.针对增量算法的特点,改进算法通过将不同位置的点剖分对应存储到不同的边链表和三角形链表中,降低了边和三角形的搜索时间,提高了三角化的速度.同时,采用了加点剖分中同步优化和初步剖分后全体再次优化的优化方案,大大提高了剖分三角形的质量.实际点云剖分的结果显示,该算法不仅速度快、占用内存小,而且形成的三角表面质量高. 相似文献
13.
一种基于遗传算法的TTP问题求解算法 总被引:25,自引:0,他引:25
提出并实现了一种高校自动排课算法,利用遗传算法建立数据模型,定义一个四维的染色体编码方式和包含学生人数,教室座位、特殊课程、教师、班级、一门课的时间间隔等因数的适应度函数,通过切片算子,生成指数要求的基因型个体,用交叉算子和变异算子对基因型个体进行运算,再利用选择算子选择适应度函数值较高的染色体编码方案,最后对优化的染色体按指定方向切片,生成教师课表,学生课表和教室课表,对某高校的真实数据进行实验,结果显示无一例教室,教师,班级冲突,在PⅢ866PC机上运行,耗时为2323.573s,该算法可以推广到车辆调度,会议安排、超大规模电路板设计等应用领域。 相似文献
14.
免疫算法与遗传算法比较 总被引:11,自引:0,他引:11
葛红 《暨南大学学报(自然科学与医学版)》2003,24(1):22-25
在介绍免疫算法与遗传算法概念的基础上,阐明了二的不同特点,并通过仿真实验表明了它们之间在功能和应用方面的区别。 相似文献
15.
模糊k-prototypes聚类算法的一种改进算法 总被引:6,自引:1,他引:6
模糊k-prototypes算法是当前聚类分析中最有效算法之一.简述了模糊k-prototypes算法的发展进程和主要性质;并在此基础上.指出它在处理数值型和分类型混合数据时的不足,进而提出一种改进算法;最后,将算法应用到英语借词之中,给出计算结果.结果表明,改进算法具有较好的稳定性和较高的精确度. 相似文献
16.
在计算机通信中,越来越多的多媒体应用如视频会议、多媒体教学系统、视频点播等需要组播技术,这就需要研究如何构造有效的组播树的问题。首先给出基于受限延时的最小代价组播树的网络模型及其教学描述;然后提出一种采用启发武算法和遗传算法的混合算法来解决该问题。该算法可以在满足延时约束的条件下,寻找出最小费用的组播树。算法仿真试验结果表明该算法有较好的性能,快速有效。 相似文献
17.
针对神经控制器和遗传算法二者各自的优缺点,提出了遗传算法和神经控制的融合算法——将遗传算法应用于神经控制器的学习和训练,使控制器兼有二者的优点从而提高控制系统的性能。运用该方法对电加热炉温度控制系统进行的Matlab仿真,结果表明采用遗传神经控制器的系统,不但提高了阶跃响应的快速性,而且大大减少了超调量。 相似文献
18.
19.
20.
目标驱动的迷宫布线算法及优化 总被引:5,自引:0,他引:5
在传统迷宫算法的基础上,结合电路布线的特点,提出了目标驱动的迷宫布线算法及优化的方法.该方法有效地减少了计算和回溯次数,在提高布线速度和缩短布线路径上均有良好的效果. 相似文献