首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 453 毫秒
1.
基于集群环境的K-Means聚类算法的并行化   总被引:1,自引:1,他引:0  
K-Means聚类算法在面对海量数据时,时间和空间的复杂性已成为K-Means聚类算法的瓶颈.在充分研究传统K-Means聚类算法的基础上,提出了基于集群环境的并行K-Means聚类算法的设计思想,给出了其加速比估算公式,并通过实验证明了该算法的正确性和有效性.  相似文献   

2.
聚类算法是数据挖掘中的一个重要研究领域,是一种数据划分或分组处理的重要手段和方法.目前其研究已深入到数据库、数据挖掘、统计等领域并取得了很大的成绩。但是由于聚类算法的多样性,使其在很多行业应用中有着不同的应用效果,基于此。本文通过聚类算法三种指标的比较,给出了一种聚类方法应用效果评估的方法.该方法结合电信的案例应用与K-Means、SOM、BIRCH等聚类方法结果的分析,最后得出K-Means方法在电信客户细分中的应用优越性.  相似文献   

3.
为了研究不同治疗抑郁症的药物(利血平、开郁安神胶囊)对抑郁症的治疗效果,用SOM和K-Means相结合的方法对用药后的抑郁症大鼠DNA的芯片样本进行聚类。结果表明,将K-Means用于收敛后的SOM网络,不仅较好地解决了SOM在训练样本后边界不清的问题,也将样本的训练结果映射在二维,有利于对聚类结果的呈现。此外,改进的...  相似文献   

4.
针对结构面产状常规分类方法存在的不足,提出一种新型的结构面分类算法.基于K-Means算法的结构面分类,将人工鱼群算法(artificial fish swarm algorithm,AFSA)与K-Means算法相结合,建立了AFSA-RSK结构面分类算法.利用鱼群算法强大的寻优能力,代替K-Means算法对结构面产状聚心集进行搜寻,并通过K-Means算法进行聚类.聚类完成后,选择相应参数指标对聚类效果进行评价.针对存在的问题,对鱼群算法的步长和视野进行修正,提高寻找聚心集的精度,动态地调整了聚类过程.将改进后的AFSA-RSK算法与其他算法进行比较,结果表明在迭代速度、聚类精度以及内存占比上,改进后的AFSA-RSK算法都要更优,更适合在结构面分组方面的应用.  相似文献   

5.
基于粒子群优化和SOM网络的聚类算法研究   总被引:2,自引:0,他引:2  
利用改进的粒子群优化算法(PSO)的优化性能,结合SOM网络模型,提出了一种基于粒子群优化算法和SOM网络的聚类算法(PSO/SOM),使用PSO对SOM网络进行训练来代替SOM的启发式训练方法.将PSO/SOM算法用于对Wine和Iris等数据集进行模式聚类识别,可以得到较优的聚类识别效果.相比标准SOM算法能有效提高网络映射的准确程度,降低网络的量化误差和拓扑误差,同时也降低了错聚率,实验结果验证了本算法的有效性.  相似文献   

6.
为了弥补K-Means算法对孤立点数据敏感的缺陷,提高K-Means算法对包含孤立点数据集的聚类效果,在深入研究K-Means算法的基础上,提出了基于PAM和簇阈值的改进K-Means聚类算法。该算法首先对待聚类数据进行抽样,然后利用PAM算法获取样本数据的聚类中心,以样本数据的聚类中心作为KMeans算法的初始聚类中心。在聚类迭代过程中动态计算各簇阈值,利用簇阈值准确地过滤孤立点数据。实验结果表明,本文提出的算法不仅聚类时间短,而且具有较高的聚类准确率。  相似文献   

7.
一种新的K-Means蚁群聚类算法   总被引:1,自引:0,他引:1  
针对蚁群聚类算法聚类质量不高的原因,使用K-Means算法改进蚁群聚类规则,提出一种新的K-Means蚁群聚类算法(KM-AntClust),并通过实验验证新算法的聚类效果.实验结果表明,新的算法可以明显提高聚类质量.  相似文献   

8.
 空间聚类和空间索引的结合是当前空间数据库中提高数据检索效率的技术之一。本文从空间聚类和空间索引的存储原理入手,阐述了K-Means聚类算法及其改进算法的技术思路,研究了K-Means算法在空间数据库中与空间索引方法结合的技术问题;分析了当前基于K-Means算法的R-树系列空间索引技术的研究成果,阐述了它们提高空间检索效率的技术路线及实验结果,研究显示这些技术都能在一定程度上提高数据检索的效率。最后给出了聚类与空间索引结合技术未来的研究方向。  相似文献   

9.
大数据背景下零售银行业的竞争日益加剧,根据客户的特征,将客户进行细分,为客户提供差异化的产品和服务是零售银行实现精准营销的有效途径。K-Means聚类算法是客户细分中的一种重要算法,它的基本思想是将具有更多相同特性的样本聚集到一个类中,使不同类中的样本之间尽可能的远离,而同一类中的样本之间尽可能的相近。为了提高客户细分的精度,提出一种自组织特征映射神经网络(SOM)的KMeans聚类算法(SOM-K-Means)。该算法可以解决K-Means聚类算法随机确定聚类个数和初始聚类中心等影响聚类结果准确性的问题。对某零售银行实证研究表明,SOM-K-Means聚类算法对购买某产品客户的数据进行有效的挖掘分析,根据聚类之间客户的不同特征,为不同客户群体提供个性化营销策略。  相似文献   

10.
为解决传统K-Means算法以及它的变种会产生较大波动的聚类结果的问题,使用改进的模拟退火算法来优化初始中心,得到一种适合对文本数据聚类分析的算法.把改进的模拟退火算法和K-Means算法结合在一起,从而达到既能发挥模拟退火算法的全局寻优能力,又可以兼顾K-Means的局部寻优能力,较好地克服了K-Means对初始化敏感、容易陷入局部最优的缺点.实验证明,该算法可以生成质量较高而且聚类质量波动性较小的结果.  相似文献   

11.
基于遗传算法的动态文本聚类   总被引:1,自引:0,他引:1  
为了解决动态文本聚类中聚类中心陷于局部极值点的问题,该文提出了基于遗传算法的动态文本聚类方法.采用二进制编码方式对聚类中心进行编码、类内中的点与其类中心的欧氏距离作为适应度函数.通过遗传算子的操作对类中心进行逐步迭代,直至适应度函数收敛,得到使聚类划分效果最好的聚类中心.实验表明该方法可以克服局部极值点的问题,且聚类结果的评价指标Purity(纯度)也比较好.  相似文献   

12.
空间聚类是空间数据挖掘研究领域中一个重要的研究课题,而传统的空间聚类方法往往忽略障碍对聚类结果的影响。本文在量子粒子群算法的基础上,研究了障碍约束的处理方法,并提出一种基于量子粒子群的带障碍约束的空间聚类算法,实验结果表明,该算法不仅有效地克服了聚类算法极易陷入局部极小值和对初始值敏感的问题,而且聚类结果比忽略障碍的量子粒子群算法更符合实际情况。  相似文献   

13.
结合聚类模型和自适应模型的遗传算法   总被引:2,自引:2,他引:0  
在进化后期,自适应遗传算法有助于保存种群中的优秀模式;但在进化初期,对适应度值大的个体的保护,易降低种群的多样性、减弱算法的搜索性能。基于聚类的遗传算法可以提高遗传算法的收敛速度和搜索性能,但交叉概率和变异概率取定值,易使优秀模式在进化后期遭到破坏,难以收敛到全局最优。在遗传算法中同时引入聚类模型和自适应模型,有利于继承两类改进型遗传算法的优点,克服各自的不足。使用经典的测试函数对引入聚类模型和自适应模型的遗传算法进行测试,仿真结果表明:同时引入聚类模型和自适应模型的遗传算法比引入聚类模型或自适应模型的遗传算法具有更好的收敛速度和寻优能力。  相似文献   

14.
K -均值聚类算法在当前提取数据挖掘的聚类分析方法中已经取得了一定的成就,为了进一步改进其在数据预处理及神经网络结构中的应用,文中对算法进行了缺陷研究,主要做了以下几个方面的工作:对K-means算法进行了思路及算法主要流程分析;得出K-均值聚类算法存在简单、迅速、结果簇密集、簇与簇之间区别较为明显等优点;分析得出算法存在与处理符号属性的数据不太适应、必须事先给出k值(想要生成的簇的个数)、对“噪声数据”以及孤立的点数据有较大影响、需要不断计算更新调整后的新聚类中心等缺点。在实验验证中结果得出:聚类结果可知,选取不同的值初始值对聚类结果的影响很小;如果聚类数据集迭代次数较多时,可以尝试着改变其数据的输入顺序;变动数据集的输入顺序,会直接影响聚类结果。实验结果对于K-均值算法的工作效率提高了具有明显的参考价值,这一研究对于数据挖掘技术的改进具有一定的意义。  相似文献   

15.
混合蛙跳算法(SFLA)是一种基于子群——种群进化模式的群智能优化算法,通过自身特有的分组算子实现不同解的合理分布,能够有效跳出局部最优;局部位置更新算子只对最差解进行更新,加快了算法的收敛速度。针对传统算法在解决聚类问题时存在聚类精度低和算法收敛速度较慢等缺点,本文提出了运用混合蛙跳算法来解决聚类问题,通过采用基于图像二维空间像素特征提取的方法构造青蛙个体解,设计青蛙进化的目标函数和青蛙位置更新策略,并通过数字,图形等验证了该算法解决聚类问题的有效性.  相似文献   

16.
讨论了三维聚类算法和模糊理论,分析了将两者结合起来的模糊聚类算法所具有的特点,以工业物料为应用前提,对其在特征的三空间中利用模糊聚类算法进行了识别,实验取得了较为满意的效果。  相似文献   

17.
RNN(相互最近邻)算法是一种基于层次的聚类算法,它比其他传统的层次聚类算法聚类更快.由于利用RNN算法对同一个数据集聚类,若选择不同簇间距离度量方式,那么聚类结果就会不同.因此在分析聚类结果对距离度量方式依赖性的基础上,采用用聚类聚集的思想,找出一种新的聚类方式,从而使得聚类效果更好.  相似文献   

18.
采用路径划分聚类算法,对Web用户访问路径进行划分,然后根据其相似度进行聚类,依据分类系数和平均模糊熵来判定簇个数的最优解,得到较好的聚类效果,为最终挖掘出用户的访问模式奠定了良好的基础.实验发现簇中心偏移次数明显减少,中心长度有所提高,证明算法具有较好的效率.  相似文献   

19.
文章提出了一种新的聚类方法NFC,首先用模糊逻辑神经元网络的聚类算法和Cauchy训练的模拟退火算法相结合的局部算法得到初始聚类中心,然后用FCM算法进行模糊聚类;实验证明,NFC算法在一定程度上解决了FCM局部极值问题且有效性非常高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号