首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对k-means算法必须事先指定初始聚类数k,并且对初始聚类中心点比较敏感,聚类准则函数对求解的最优聚类数评价不理想,提出一种基于局部密度的启发式生成初始聚类中心方法,在此基础上设计一种准则函数自动生成聚类数目,改进了传统k-means算法.实验表明改进的算法比传统k-means算法提高了聚类效率.  相似文献   

2.
经典的分布式k-means聚类算法随机选取初始聚类中心,进行多次的迭代,容易使得聚类效率低,网络通信量大,而且聚类结果不稳定。针对这些问题,提出一种改进的分布式k-means聚类算法。该算法通过划分数据集,计算属性最密集的k个数据块作为聚类中心,以确保聚类中心的代表性,进而减少算法的迭代计算次数,提高聚类效率。通过在Hadoop分布式平台上进行实验,结果表明改进算法能减少迭代次数和收敛时间。  相似文献   

3.
针对K-means聚类算法对初始聚类中心敏感问题,提出1种结合方差与误差平方和的优化算法.首先,该算法基于方差和距离选取k个位于不同区域且样本点相对集中的集合.然后,分别选取使这k个样本集合误差平方和最小的数据作为k个初始聚类中心.利用改进算法与其他算法将UCI数据库中所选取的数据集进行聚类划分,对比不同算法下的聚类结...  相似文献   

4.
文章针对物流企业的订单分批问题,提出了改进的Canopy-k-means算法。该算法是采用Canopy算法依据最大最小原则生成初始聚类中心,并使用k-means聚类算法对其进行优化获取分批结果的。此外,文章针对不同规模的订单数据集,比较了该算法和先来先服务(first come first served,FCFS)、k-means以及Canopy-k-means算法的实际效果,实验结果表明:该算法可以避免k-means算法中k值选取的盲目性,同时可以有效地提高分拣效率以及降低分拣批次。  相似文献   

5.
随机选择初始聚类中心的k-means算法易使聚类陷入局部最优解、聚类结果不稳定且受孤立点影响大等问题.针对这些问题,提出了一种优化初始聚类中心的方法及孤立点排除法.该算法首先选择距离最远的两点加入初始化中心,再根据这两点将原始簇分成两个聚簇,在这两个簇中挑选方差较大的簇按照一定的规则进行分裂直至找到k个中心,初始中心的选择过程中用到孤立点排除法.在UCI数据集及人造含一定比例的噪音数据集下,通过实验比较了改进算法与其他算法的优劣.实验表明,改进后的算法不仅受孤立点的影响小、稳定性好而且准确度也高.  相似文献   

6.
针对传统k-means聚类方法随机选择初始聚类中心而导致的收敛速度慢、聚类效果较差的问题,本文结合空间相似度度量提出一种改进的k-means初始聚类中心选择方法.该方法通过定义空间中样本的相似度,从而选择相似度较小的样本作为初始聚类中心,以减少达到聚类稳定状态的迭代次数,提高聚类的效率.UCI数据集上的实验结果表明,与传统k-means聚类方法相比,本文提出的改进的k-means初始聚类中心选择方法能够使聚类的收敛速度加快,得到良好的聚类效果.  相似文献   

7.
一种新的基于蚁群原理的聚类算法   总被引:1,自引:1,他引:0  
为了改善聚类分析的质量,提出一种与蚁群原理相结合的聚类方法. 首先对传统的聚类算法k-means进行改进,克服传统的k-means算法必须事先确定分类的个数k和选择聚类点的缺陷,然后将蚁群算法的转移概率引入k-means算法,对上述聚类结果进行二次优化.实验结果表明,改进的k-means与蚁群算法相结合的聚类方法比单一聚类算法更有效.  相似文献   

8.
针对传统k-means算法中初始聚类中心选取的随意性对于聚类结果影响较大的问题,提出了基于Leader算法的k-means改进算法——Lk-means算法.该算法有效避免了初始聚类中心选取的边缘化和随意性.实验证明,Lk-means算法的聚类结果更加有效合理.  相似文献   

9.
针对经典k-means聚类算法的弊端进行一定程度上的改进,提出一种新的基于距离相等函数决定最佳聚类值的改进方法.实验采用两大类标准数据集来测试该算法,并和k-means算法的结果进行了比较,证实了该改进算法的有效性,解决了聚类数目k值的难确定性问题.  相似文献   

10.
基于k-means算法的k值优化的研究与应用   总被引:2,自引:0,他引:2  
k-means算法是经常使用的一种聚类算法,但是易受聚类个数k的影响,其性能主要取决于k值优化,因此对近年来k-means算法的研究现状与进展进行总结。对较有代表性的k值优化的k-means算法,从思想、关键技术等方面进行分析概括,并选用著名数据集对一些典型算法进行了测试,主要从同一个数据集、不同的k值优化情况进行对比分析.上述工作将为聚类分析和数据挖掘的研究提供有益的参考.  相似文献   

11.
改进k均值聚类算法在网络入侵检测中的应用研究   总被引:2,自引:0,他引:2  
针对k-means算法事先必须获知聚类数目以及难以确定初始中心的缺点, 提出了一种改进的k-means聚类算法.改进后的算法首先使用了复合形和粒子群算法来选取聚类的初始中心点,然后使用k-means算法快速收敛获取聚类结果.实验表明:把改进后的算法用于网络入侵检测系统中,可以提高不需指导的异常检测的检测率,降低误检率.  相似文献   

12.
为克服k-means算法对初始聚类中心敏感的缺点,提出用改进后的人工蜂群算法来优化k-means算法的聚类中心。用最大距离积法对蜜源进行初始化,提高了蜜源的质量。增加蜜源搜索范围的动态调整因子,加快了算法的收敛速度。蜂群间经验值的交换,让算法在跳出局部最优解的同时,获得一个适应度值较高的蜜源;孤立点的寻找进一步提高了算法的有效性。实验表明,该算法加快了算法的收敛速度并提高了k-means聚类结果的准确度。  相似文献   

13.
提出了一种基于改进混合并行遗传算法的多文档文摘方法.该方法将k-means聚类算法的高效、局部搜索特性,和并行遗传算法的全局优化能力有机结合,解决了k-means算法对初始聚类中心的选择较为敏感,易于陷入局部最优等问题,提高了多文档聚类算法的效率和精确度.  相似文献   

14.
可见光通信系统中,正交频分复用技术的高峰均功率比会加大发射信号产生非线性失真的概率。为了降低系统的误码率,提出了一种改进的k均值(k-means)算法的非线性补偿技术。该算法考虑了信号的传输特性,运用Dijkstra算法优化了k-means算法中初始点的选择,能够准确地找到接收信号星座图的聚类中心,避免了传统k-means算法在选择初始聚类点时陷入局部最优解。仿真结果表明,相比于传统的k-means算法,改进的k-means算法能更准确地找到非线性失真后信号的星座点位置,因此能有效地解决可见光通信系统的非线性问题,降低了系统的误码率。  相似文献   

15.
研究了K均值算法中初始聚类中心的选择对算法本身聚类精度及效率的影响,并提出了改进的算法(LK算法,Leader+K-means).LK算法中的初始聚类中心选择不是随机的,而是利用Leader算法得到若干个初始类中心,然后选择包含数据项最多的k个类中心,作为K均值算法的初始类中心.实验结果表明,LK算法在聚类结果的稳定性和正确率方面都是有效可行的.  相似文献   

16.
针对高维数据下的聚类效果需要提高,提出一种基于期望最大化的k-means聚类改进算法.该算法在没有降维和破坏原有数据结构的情况下,把期望最大化算法和k-means算法相结合,用期望最大化算法选取k-means的算法的初始聚类中心.并针对高维数据提出一种新的距离算法,代替传统的距离算法.实验结果表明提出的算法的可行性,并且在处理高维数据时的有效性.  相似文献   

17.
根据对象邻域的分离度和耦合度确定初始聚类中心,提出一种基于邻域模型的k-means改进算法,并以KDD CUP 99数据集为对象,对入侵检测进行了仿真实验.结果显示,改进后的算法在入侵检测率和误检率方面均优于IKCM算法和传统的k-means算法.  相似文献   

18.
k-means算法原理简单、收敛速度快,但易陷入局部最优,且须将聚类的类簇数作为先验知识,为此,引入量子微粒群与k-means算法结合,提出了一种改进的动态聚类算法。改进算法具有量子微粒群的全局搜索能力,且对每个粒子采用k-means进行优化,从而加快算法的收敛速度。通过适应度函数值的调整,算法在聚类中能够搜寻到最优类簇数,这样类簇个数和中心就不受主观因素的影响。实验表明,算法有效。  相似文献   

19.
针对MinMax k-means算法易产生空解、 收敛速度慢和计算效率低的问题, 提出一种增量式MinMax k-means聚类算法. 该算法从给定的初始聚类个数开始, 以固定步长递增式产生新的聚类中心, 采用基于数据均衡的快速分裂方法产生增量聚类中心, 从而避免了传统增量聚类中心选择中遍历数据、k-means聚类算法运行次数过多导致的大计算量问题. 与MinMax k-means及相关算法的对比实验结果表明, 该算法在计算效率和求解精度上均优于对比算法, 有效改善了MinMax k-means聚类对初始化中心敏感和易产生空解的问题.  相似文献   

20.
对近年来k-means算法的研究现状与进展进行总结.首先对较有代表性的初始聚类中心改进的算法,从思想、关键技术和优缺点等方面进行分析.其次选用知名数据集对典型算法进行测试,主要从就同一个数据集不同改进算法的聚类情况进行对比分析,为聚类分析和数据挖掘等研究提供有益的参考.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号