首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 359 毫秒
1.
基于动态隧道系统的K-means聚类算法研究   总被引:1,自引:0,他引:1  
针对K-means聚类算法易陷入局部极小的问题,利用动态隧道算法在解决全局最优化问题中的有效性,将算法中的动态隧道过程引入到K-means聚类算法中,提出了一种基于动态隧道算法的K-means聚类算法.该算法在K-means聚类算法寻优得到的局部极小值基础上,利用动态隧道过程寻找更小的能量盆地,再将其值提交给K-means聚类算法进行迭代寻优,重复该过程,直到找到全局最小值.理论分析和仿真实验证明,该算法的聚类效果要优于K-means聚类算法.  相似文献   

2.
针对全局K-means聚类算法和快速全局K-means聚类算法在选择下一簇的聚类中心点时,需要逐一计算数据集中每个点作为备选聚类中心点时的簇内平方误差函数,而数据集中存在很多不可能作为备选点的噪声点.为剔除噪声点,提出了一种基于高密度数的DGK-means算法,并通过UCI数据库中的4组数据集进行实验测试.验证了在聚类效果稳定的前提下,改进的DGK-means算法比全局K-means算法和快速全局K-means算法,聚类用时更短,聚类效率更高.  相似文献   

3.
一种基于余弦因子改进的混合聚类算法   总被引:1,自引:0,他引:1  
为了解决传统的K-means聚类算法全局优化性差,容易陷入局部最优的问题,用具有全局自适应优化特点的遗传算法与K-means算法结合来改善聚类效果.在此基础上提出了基于余弦因子改进的混合聚类算法(SGKM),在交叉和变异操作时用基因余弦因子(GCOS)进行个体控制,确保差的个体不会被引入下一代,并采用交叉和变异概率的自适应控制,结合了K-means算法的高效局部搜索和遗传算法的全局优化能力.实验结果表明,与其他基于K-means算法改进的聚类算法相比,SGKM算法能获得更小的簇内距和更大的簇间距,且数据对象的分类准确率有一定的提高.应用SGKM算法进行聚类不易受到不良个体的干扰,可以有效地改善聚类效果.  相似文献   

4.
针对寿险行业的客户流失问题,构建基于外在、内在、行为(EIB)属性的寿险客户指标体系.提出改进的K-means算法,使用改进的轮廓系数公式判断初始聚类数目,并利用欧式距离相似度与余弦相似度的测度优势提出欧式类簇空间的局部、全局离群点过滤规则.运用传统的K-means算法、不同离群点监测阈值下的改进K-means算法进行...  相似文献   

5.
一种改进的K一均值聚类算法   总被引:2,自引:0,他引:2  
为了改进K-means聚类算法的不足,把混合粒子群优化算法引入到K-means聚类算法中,重新选取编码方式并构造适应度函数,在此基础上提出了一种改进的K-means聚类算法;通过两个经典数据集的测试,实验结果表明:改进的算法比K-means算法具有更好的全局寻优能力、更快的收敛速度,且其解的精度更高对初始聚类中心的敏感度降低.  相似文献   

6.
为了有效解决云计算环境下海量数据的并行聚类问题,以典型的基于距离的Kmeans聚类算法为例,提出了一种MapReduce并行聚类优化算法.首先将差分进化算法与K-means算法相结合,从而利用差分进化算法的强大全局搜索能力克服典型K-means算法对初始中心较为敏感的缺点,利于增强全局最优解的稳定性.然后把优化后的算法在Hadoop的Map Reduce框架下做了并行化的设计.实验结果表明,与其他多种分布式设计相比,提出的并行聚类优化算法能够在保证聚类效果的前提下,大大减少了运算的时间,提高了大规模数据的聚类效率.  相似文献   

7.
K-means聚类算法简单,收敛速度快,但是聚类算法的结果很容易受到初始聚类种群的影响,往往导致局部最优。差分进化算法具有很强的全局收敛能力和鲁棒性,但其收敛速度较慢。为此,将K-means聚类算法和差分进化算法相结合,提出一种基于K-means的改进差分进化聚类算法。该算法设置在一定范围内随迭代次数动态增加的交叉算子,以使算法在迭代过程中先进行全局搜索,再进行局部搜索,这样有助于平衡算法的全局寻优和局部搜索能力,并且加快了算法的收敛速度。最后,通过实验测试了算法的有效性。  相似文献   

8.
聚类是一种高效的数据分析方法,经典的K-means算法只适用于类簇为凸形的数据集,谱聚类算法虽然避免了K-means的一些缺点,但相似度中的参数设置问题以及较高的计算、存储复杂度对聚类有所限制.基于局部和全局信息的正则化迭代聚类,先取部分数据作为一个整体聚类,然后逐渐加入少量数据进行迭代求解.该方法继承传统谱聚类的优点,充分利用局部正则化和全局正则化信息,通过迭代方式求解使较大规模数据聚类成为可能.通过实验对比结果显示,该算法有良好的聚类效果.  相似文献   

9.
针对K-均值聚类算法存在的缺陷,将改进的粒子群优化算法———智能单粒子优化算法(ISPO)应用到聚类分析当中来,提出一种混合聚类算法ISPO+K-means.该算法分为两个阶段:第一阶段利用ISPO算法较强的全局寻优能力形成初始聚类,第二阶段将初始聚类结果通过K-means算法形成最终聚类结果输出.与K-均值聚类算法和...  相似文献   

10.
为了解决K-means算法在随机初始化过程中影响到K-means算法的效率性和正确性问题.提出了一种改进的方法(IKM),该方法是一种改进K均值的算法,利用密度、网格和统计等概念,将IKM的模拟数据与K-means进行比较.结果证明IKM的效率性和正确性优于K-means算法,对于复杂的情况在数据分布方面,IKM的表现优于K-means算法.  相似文献   

11.
将K-means聚类算法在对事物分类中的优点用于判断变压器的故障中.并针对K-means聚类法在给定初始聚类中心不良的问题上进行改进.将改进的K-means聚类算法与三比值法相结合,以此来诊断变压器的多种常见故障.应用MATLAB分别对改进前后的K-means算法进行仿真,并将改进后的仿真结果同改进前K-means聚类算法的结果进行对比分析.结果表明,改进的K-means聚类算法不但能精确、有效地对变压器故障进行诊断,并且改进的K-means聚类法使仿真结果更加准确可靠.  相似文献   

12.
黄欣  余思东  赵志刚 《广西科学》2020,27(1):104-109
针对车载自组织网(Vehicular Ad Hoc Networks,VANETs)拓扑结构经常变化导致通信链路容易断裂而通信质量不可靠的问题,将人工蜂与K-means混合算法应用在VANETs中。在成簇阶段,该混合算法利用人工蜂算法较强的全局搜索能力确定初始聚类中心,代替传统的K-means对初始聚类中心的选择,这样就消除了K-means对随机初始聚类中心的依赖。在簇头选取阶段,类内具有最小的速度方差以及到其他节点最小平均距离的车辆节点被选择为簇头。在簇的维护阶段,当最优节点即簇头有变化时,次优节点被选为临时簇头,直至更新为最优节点的簇头信息。为测试该混合算法的性能,将其和PSO与K-means混合算法、经典K-means算法进行实验对比,结果表明,该混合算法能够更加稳定VANETs通信链路,具有更高成簇质量和更高通信质量。  相似文献   

13.
针对K-means算法易受聚类中心影响而陷入局部最优的问题,提出一种基于改进森林优化算法的K-means聚类算法。首先,将衰减因子引入传统算法中提出一种自适应微量步长方法,以加快算法收敛速度,并改善算法的全局搜索与局部开发能力;然后,结合遗传算法中的算术交叉操作思想,改进传统算法全球播种阶段的选择策略,使得算法能够跳出局部最优,提高算法优化精度。通过基准测试函数实验,验证了改进算法的有效性和优越性。最后,结合改进算法和K-means算法,提出一种新的聚类算法,并通过在UCI数据集上的实验结果表明,提出的聚类算法具有较高的聚类准确率。  相似文献   

14.
为提高K-means算法全局搜索能力,提升聚类效果,提出一种基于近似骨架和混合蛙跳算法的K-means方法。该方法首先利用经典的混合蛙跳算法取代K-means算法中原有迭代公式,获得更优秀的聚类结果;然后对获得的聚类结果,使用基于近似骨架和混合蛙跳算法的K-means算法不寻找聚类中心,而是直接对簇的划分进行修改。UCI数据集实验结果表明,使用改进的聚类算法获得的聚类结果,较其他算法结果更为优秀。最后将改进后的聚类算法应用到医学眼底病历图像中,可以得到较好的血管切割效果。  相似文献   

15.
基于工业领域广泛用到的Hadoop分布式计算平台,使用Canopy+K-means算法对手写数字进行聚类研究.针对传统Canopy算法初始阈值的确定问题,引入"最大最小化原则"确定初始阈值,计算得到K-means算法所需的初始聚类中心点.实验结果表明,Canopy算法能够较大程度地提高K-means算法的正确率.  相似文献   

16.
目的探索同时确定K-means算法的最佳聚类数K和最佳初始聚类中心的方法,使K-means算法的聚类结果尽可能地收敛于全局最优解或近似全局最优解。方法以次胜者受罚竞争学习(Rival Penalized Competitive Learning,RPCL)作为K-means的预处理步骤,以其学习结果作为K-means的聚类数和初始聚类中心并依据数据集样本自然分布定义样本密度,将此密度引入RPCL的节点权值调整,以此密度RPCL的输出作为K-means的最佳聚类数K和最佳初始聚类中心。采用UCI机器学习数据库数据集以及随机生成的带有噪音点的人工模拟数据集进行实验测试,并用不同的聚类结果评价指标对聚类结果作了分析。结果提出的密度RPCL为K-means提供了最佳的类簇数和最佳的初始聚类中心。结论基于密度RPCL的K-means算法具有很好的聚类效果,对噪音数据有很强的抗干扰性能。  相似文献   

17.
给出了K-means算法和层次聚类算法在具体网站用户细分中准确率的比较,在细分网站用户这一类问题中,K-means算法在聚类准确率和处理速度上具有较大的优势,能够满足网站用户细分准确率的基本要求,其聚类准确率达到95%左右,且K-means算法处理速度比较快;层次聚类算法的处理速度较K-means算法慢,且其聚类准确率在处理大量用户数据时低于92%,这对于处理网站用户数据这类信息并不具备优势.  相似文献   

18.
为了克服K-means聚类算法的不足,提出了一种改进的人工蜂群算法。通过在蜜源搜索策略中加入动态调整因子,使得算法在不同的进化时期能够自动地调整搜索范围,增强了算法的全局搜索能力和局部开采能力。引入了包含更多最优解信息的中心解思想,提高了蜂群的搜索效率,加快了算法的收敛速度。利用改进后的蜂群算法来优化K-means算法,以改善聚类效果的性能。试验结果表明,优化后的K-means算法具有较强的稳定性,且聚类效果有了明显改善。  相似文献   

19.
基于经典流聚类框架CluStream和密度聚类算法DBSCAN,提出了一种分布式实时数据流密度聚类算法DBS-Stream,并在Storm流式处理平台上设计了算法实现方案.该算法局部节点使用CluStream的两段式经典框架,在线微聚类中利用DBSCAN代替K-means初始化数据,在中心节点再使用DBSCAN算法进行全局聚类.该算法可解决任意型聚类问题,并可使局部节点快速更新数据.将DBS-Stream算法与CluStream算法进行比较,实验结果表明,本研究算法在聚类质量和通信代价方面均优于CluStream.  相似文献   

20.
针对现有(Rival Penalized Competitive Learning,RPCL)算法之不足,提出根据样本数据集自然分布规定样本密度,把此密度代入次胜者受罚竞争学习算法(RPCL)节点权值调整的改进RPCL算法;以改进RPCL算法对数据集进行预处理,确定K-means算法的合理类簇数目和最佳初始聚类中心,提高K-means算法的聚类效率和聚类准确性,促进其尽快地收敛至全局最优解。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号