首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
一种改进的基于遗传算法的K均值聚类算法   总被引:2,自引:0,他引:2  
结合遗传算法和K均值聚类算法的优点,提出一种改进的基于遗传算法的K均值聚类算法.将遗传算法的编码方法、初始化、适应度函数、选择、交叉和变异等较好地应用于聚类问题,不仅解决了K均值聚类算法中K值难以确定、对初始值敏感以及遗传算法存在收敛性差和容易早熟的缺点,而且实现了聚类中心的优化选择、K值的自动学习和基因的自适应变异等...  相似文献   

2.
为解决传统 K-means 算法中因初始聚类中心选择不当而导致聚类结果陷入局部极值的问题, 采用蝙蝠算法搜寻 K-means 算法的初始聚类中心, 并将模拟退火的思想和基于排挤的小生境技术引入到蝙蝠算法中, 以克服原始蝙蝠算法存在后期收敛速度慢、 搜索力不强等问题。 同时, 通过测试函数验证了其有效性。 最后利用改进后的蝙蝠算法优化 K-means 算法的初始聚类中心, 并将该改进的算法与传统的 K-means 算法的聚类结果进行了对比。 实验结果表明, 改进后的算法的聚类性能比传统的 K-means 算法有很大提高。  相似文献   

3.
基于K -均值聚类的混合聚类算法   总被引:1,自引:0,他引:1  
K-均值聚类算法是聚类算法中比较典型的算法之一,在其各类改进算法中都受到了离群点、初质心、类个数等因素的干扰。本文利用相似密度提出一种新的聚类初始质心选取和离群点判别方法,对K-均值聚类算法进行了改进。通过实验证明改进算法提高了聚类的有效性和稳定性。  相似文献   

4.
基于遗传算法的模糊c-均值聚类算法   总被引:5,自引:0,他引:5  
基于误差平方和准则的模糊c-均值算法(FCM)是一种典型的动态聚类算法,其求解结果通常是局部最优解;当模糊集合之间的并、交、包含运算采用传统定义时,在模糊c-均值聚类结果中还会存在无意义的聚类集.研究表明采用遗传算法进行模糊c-均值聚类(Fuzzy c-means algorithm over genetic algorithm,GFCM)时,不仅能够消除无意义的聚类集,而且还在一定程度上避免模糊c-均值算法收敛到局部最优解,为此设计编码、选择、配对交叉、变异等步骤.测试数据实验表明采用GFCM算法的结果优于FCM算法.  相似文献   

5.
针对传统K均值聚类算法对初始聚类中心敏感,易陷入局部最优和对大数据集聚类速度慢的缺点,将ARIA与Kmeans算法相结合,提出了一种ARIA-Kmeans算法,即基于自适应半径免疫的K均值聚类算法。首先利用自适应半径免疫算法对数据进行预处理,产生能够代表原始数据分布以及密度信息的内部镜像数据;然后用K均值聚类算法对其进行多次聚类,获得最佳聚类中心,并将其作为初始聚类中心,推广到全部数据优化聚类效果;最后对其结果进行评价。实验结果表明,相对于传统Kmeans算法,新算法在保证聚类准确度的前提下,提高了算法运行的时间效率和稳定性。  相似文献   

6.
该文将量子人工蜂群(Quantum artificial bee colony, QABC)算法用于K均值(K-means)聚类的类别中心点选择,优化K均值聚类算法,可有效解决因随机设置K均值中心点而导致聚类准确度不高的问题。该文设置K均值聚类类别数,并随机设置若干类别中心,采用人工蜂群(Artificial bee colony, ABC)算法优化类别中心点,根据待聚类样本点构建蜜蜂种群,并对蜂群个体位置采用量子比特表示。以样本点和中心点的距离的倒数作为ABC算法适应度,并将适应度值较高个体定义为蜜源。通过引领蜂在运动范围内的粗粒度遍历和跟随蜂的细粒度探索,不断搜寻适应度较高个体,并且更新蜜源,直至ABC算法稳定后确定较优蜜源位置为聚类中心。采用ABC优化得到的聚类中心进行K均值聚类。试验结果表明,通过合理设置ABC搜索边界,并引入蜂群位置的量子表示,可有效增强ABC对聚类中心的搜索精度。相比于常用聚类算法,QABC+K均值算法的聚类性能更优。  相似文献   

7.
针对传统模糊C均值聚类算法(FCM)的缺陷,提出了一种基于改进遗传算法的模糊聚类方法.利用改进遗传算法强大的全局寻优能力,这种算法较好地克服了FCM算法对初始化敏感、容易陷入局部最优的缺陷.仿真实验证明,该算法具有较强的全局寻优能力和较快的收敛速度.  相似文献   

8.
 针对一般直觉模糊C均值聚类算法在寻优过程中易陷入局部最优解的问题,利用遗传算法具备全局寻优的优点,提出了一种基于遗传算法的直觉模糊C均值聚类算法。在该算法中聚类中心为直觉模糊数,这使得遗传过程中个体信息变得复杂,进而增大了约束问题的处理难度。本文对产生的个体采用适时分段的归一化方法,很好地解决了该问题。仿真结果表明该算法所得聚类结果不仅准确而且更为细致。  相似文献   

9.
传统图像分割方法大都存在分割速度低下、过度分割等缺点.针对上述问题,提出一种新的彩色图像区域分割算法.这种方法首先将图像转化至L*a*b*空间,并划分为子块,抽取图像子块的颜色、纹理和位置特征组成子块的特征向量,然后运用减法聚类,获得聚类簇数和初始蔟中心,最后利用改进的K均值算法在像素点特征空间进行聚类,进而分割图像成区域.实验结果表明这种新方法具有分割效率高、分割效果理想等优点.  相似文献   

10.
基于免疫粒子群的K均值聚类算法   总被引:2,自引:0,他引:2  
粒子群算法是一类高效求解连续函数优化的随机搜索算法,在K均值聚类算法中得到广泛应用,但是在群体进化后期容易陷入局部极值,针对算法缺点,提出了一个新的聚类算法--基于免疫过程的粒子群K均值聚类算法,并将此算法与K均值聚类算法和粒子群K均值聚类算法进行比较.理论分析和数据实验证明,该算法有较好的全局收敛性,不仅能有效的克服传统的K均值聚类陷入局部极小值的缺点,而且全局收敛能力优于基于粒子群的K均值聚类算法.  相似文献   

11.
为了提高数据挖掘的聚类准确度,提出了一种基于菌群优化的K均值(K-means)聚类算法.采用K均值算法建立数据聚类模型.根据聚类类别数设定多个聚类中心坐标.设定所属类别距离阈值,然后计算待聚类点和所有中心点距离来划分该聚类点的类别.根据参与聚类各节点和各自中心点的距离值建立适应度函数.引入菌群优化算法对K均值聚类过程进...  相似文献   

12.
王林  吴海桥  郑友石 《科技信息》2010,(32):I0136-I0137
K均值算法是聚类方法中常用的一种划分方法,有很多优点,但也存在不足之处,它对球状、凸形分布的数据具有很好的聚类效果,但对样本的输入顺序敏感,可能产生局部最优解,而且受孤立点影响比较大。本文针对这些不足之处,主要从数据预处理。初始聚类中心的选择和迭代过程聚类种子计算三方面进行改进,并做了改进前后算法的对比实验。结果表明,改进后的算法比原k均值算法具有更高的准确性,受孤立点的影响也大大降低。  相似文献   

13.
针对传统K均值算法中采取的欧氏距离计算相似性的不足,提出一种新的相似性计算方法,并将这种方法与欧氏距离的度量方法进行了比较。在UC I基准数据集上的实验表明,该方法有更稳定的聚类结果,是一种比较有效的聚类度量方法。  相似文献   

14.
研究了带压缩因子的粒子群算法,通过配置最优参数以及控制收敛速度来改进粒子群聚类算法,并利用它对IRIS数据集和WINE数据集进行测试.实验结果表明,改进后的算法能控制粒子群的更新速度,并有效改进粒子群算法的准确率和全局收敛性.  相似文献   

15.
基于模糊c-均值算法和遗传算法的新聚类方法   总被引:2,自引:1,他引:1  
为了得到最佳聚类数和相应的每一类中的样本,文中首先介绍了一种新聚类方法,用该方法构造了一个既考虑类与类之间的分散程度、又考虑同一类紧凑程度的目标评价函数;再运用模糊c-均值算法(FCM)进行迭代,求得每一类的中心和隶属度值;然后运用遗传算法搜索全局极值点;最后运用该算法对我国全要素生产力进行了模糊分类.  相似文献   

16.
经典的 K 均值聚类算法是基于欧式距离的,它只适用于球形结构的聚类,而且在处理数据时不考虑变量之间的相关性和各变量的重要性差异.针对以上问题改进了 K 均值聚类算法,将马氏距离与 K 均值相结合,并在目标函数中增加变量权重因子和协方差矩阵调节因子,利用马氏距离优点有效地解决了 K 均值聚类算法的缺陷,最后通过实验证实了该方法的可行性和有效性  相似文献   

17.
为了提高人力资源推荐系统的效率,提出一种基于Spark平台的K均值聚类算法来完成人力资源推荐;Spark平台在分布式系统所有节点的内存弹性分布式数据集中完成聚类迭代运算,以加快聚类速度;将K均值聚类算法与聚类簇思想相结合,以提高大规模数据样本聚类的效率,得到聚类结果后,采用动态推荐算法实现人力资源实时推荐。结果表明,Spark平台相比于单机在聚类计算效率方面更有优势,且所提出的算法比单机的K均值聚类算法的聚类速度和准确率均更优,在动态推荐性能方面也优于常用推荐算法。  相似文献   

18.
K均值算法利用K个聚类的均值作为聚类中心,通过对比样本到各聚类中心的距离,将样本划分到距离最近的聚类中,从而实现样本的聚类.分析了K均值算法的基本原理和实现步骤,并将其应用于数据聚类和图像分割,取得了较好的聚类效果.最后,针对K均值算法的不足之处,提出了改进措施,提高了K均值算法的聚类性能.  相似文献   

19.
传统的K均值聚类算法是确定性的迭代算法,具有探索能力弱、容易陷入局部最优的缺点.在聚类中心的更新过程中加入系数因子线性递减的随机项,使改进的迭代算法在前期具有强的探索能力,而在后期保持良好的局部搜索能力,同时保持了传统K均值聚类算法结构简单的特点.实例说明,增加了随机项的K均值聚类算法具有良好的全局优化能力.  相似文献   

20.
一种改进的K一均值聚类算法   总被引:2,自引:0,他引:2  
为了改进K-means聚类算法的不足,把混合粒子群优化算法引入到K-means聚类算法中,重新选取编码方式并构造适应度函数,在此基础上提出了一种改进的K-means聚类算法;通过两个经典数据集的测试,实验结果表明:改进的算法比K-means算法具有更好的全局寻优能力、更快的收敛速度,且其解的精度更高对初始聚类中心的敏感度降低.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号