首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
基于免疫粒子群的K均值聚类算法   总被引:2,自引:0,他引:2  
粒子群算法是一类高效求解连续函数优化的随机搜索算法,在K均值聚类算法中得到广泛应用,但是在群体进化后期容易陷入局部极值,针对算法缺点,提出了一个新的聚类算法--基于免疫过程的粒子群K均值聚类算法,并将此算法与K均值聚类算法和粒子群K均值聚类算法进行比较.理论分析和数据实验证明,该算法有较好的全局收敛性,不仅能有效的克服传统的K均值聚类陷入局部极小值的缺点,而且全局收敛能力优于基于粒子群的K均值聚类算法.  相似文献   

2.
针对K均值聚类算法易陷入局部最小的缺点,提出了一种多种群协同进化的微粒群和K均值混合聚类算法,它将整个种群分解为多个子种群,各子种群独立进化,周期性地更新共享信息.同时将此算法与现有的基于遗传算法的K均值聚类算法进行了比较.实验结果证明,该算法能有效地克服传统的K均值算法易陷入局部极小值的缺点,同时全局收敛能力优于基于遗传算法的K均值聚类算法.  相似文献   

3.
在K均值算法中, 对于随机的初始值选取可能会导致不同的聚类结果,甚至存在着无解的情况;还有该算法是基于梯度下降的算法,因此不可避免地常常陷入局部极优.针对K均值聚类算法存在的缺点,提出了一种新的聚类算法--基于粒子群的K均值聚类算法,理论分析和实验表明该算法有较好的全局收敛性,能有效地克服传统的K均值算法易陷入局部极小值的缺点,采用改进后聚类算法对电信客户数据进行聚类分析,得到具有不同特征的客户群组,聚类结果分析更合理清晰,更便于对不同群组采取不同的经营策略,为管理者提供了合理的决策支持.  相似文献   

4.
针对传统K均值算法需要提前指定聚类数目且易陷入局部最优的问题,提出了一种采用万有引力定律自动确定类数的K均值算法(Gravity K均值算法,GK均值算法)。所提算法利用正交设计方法在数据空间均匀投放若干探测器,探测器根据万有引力定律移动,当两个探测器的距离小于给定阈值时合并为一个,当探测器处于稳定状态时,探测器的个数就是聚类的数目。将得到的探测器作为K均值算法的初始中心点,有效地避免了K均值算法陷入局部最优。实验结果表明:相比传统K均值算法,本文提出的方法可以自动确定聚类数目,并给出较好的初始中心,算法的迭代次数至少减少了25%,聚类正确率平均提高了14%,DB(Davies and Bouldin)聚类评价指标平均降低了0.19。  相似文献   

5.
为了解决传统K均值算法在处理大规模数据时的局限性,在近似K均值算法(AKM)基础之上,利用对聚类中心进行分类的思想,提出了快速近似K均值算法(FAKM).该算法舍去了在AKM聚类结果中只获得少数样本的聚类中心,并充分利用类内样本密集稳定的聚类中心,使得迭代过程中待聚类样本数和类别数逐步减少,达到了提高算法速度及精简聚类结果的目的.将FAKM算法运用于实际的图像检索系统中,实验结果表明,系统在检索准确率、检索时间和聚类时间方面都得到了很好的改善.  相似文献   

6.
基于人工免疫粒子群优化算法的动态聚类分析   总被引:1,自引:0,他引:1  
模糊C-均值聚类算法受初始化影响较大,在迭代时容易陷入局部极小值。将粒子群优化算法与模糊G-均值聚类算法相结合,提出一种新颖的动态聚类算法。该算法利用人工免疫思想改进粒子群优化过程,在很大程度上避免了粒子群算法和聚类算法早熟现象的发生,全局搜索能力和局部搜索能力优于同类算法。利用聚类理论中的经验规则kmax≤√n确定聚类数k的搜索范围,在最优粒子基础上进化新一级种群,该方案可有效提高算法的收敛速度。两组数据的仿真实验表明,新算法优于传统模糊C-均值聚类算法,具有收敛速度快和解的精度高的特点。  相似文献   

7.
基于蚁群算法的模糊C-均值聚类算法在声纹识别中的应用   总被引:3,自引:3,他引:3  
提出了一种基于蚁群算法(ACG)的模糊动态C-均值聚类算法的声纹识别,该算法首先利用蚁群算法的较强处理局部极值的能力,克服了算法在选取聚类中心点时采用随机选取易使得迭代过程陷入局部最优解的缺点,动态地确定了聚类中心和数目.两者有机结合起来可以寻求到具有全局分布特性的最优聚类.将此算法运用于声纹识别上,从语音信号中提取待识别的特征矢量集,对待识别声纹信号进行识别.实验证明,该算法解决了算法对初始值敏感,易陷入局部最优的问题,且计算简单,识别率较高,具有较好的鲁棒性.  相似文献   

8.
通过将半监督学习的思想引入到模糊C-均值聚类方法中,提出一种基于半监督的模糊C-均值聚类算法,有效解决了模糊C-均值聚类算法随机选取初始聚类中心导致聚类结果局部收敛的问题,能客观获取最佳聚类数目和初始聚类中心.实验结果表明,与传统模糊C-均值聚类算法相比,基于半监督的模糊C-均值算法在一定程度上减少了迭代次数,降低了对初始聚类中心的依赖性.  相似文献   

9.
提出了一种基于蚁群算法(ACG)的模糊动态C-均值聚类算法的声纹识别,该算法首先利用蚁群算法的较强处理局部极值的能力,克服了算法在选取聚类中心点时采用随机选取易使得迭代过程陷入局部最优解的缺点,动态地确定了聚类中心和数目.两者有机结合起来可以寻求到具有全局分布特性的最优聚类.将此算法运用于声纹识别上,从语音信号中提取待识别的特征矢量集,对待识别声纹信号进行识别.实验证明,该算法解决了算法对初始值敏感,易陷入局部最优的问题,且计算简单,识别率较高,具有较好的鲁棒性.  相似文献   

10.
K中心点算法是一个常用的聚类算法,它的主要缺陷是容易陷入局部极值,计算代价太高.本文先构造一个运用余弦相似度的K中心点文档聚类算法,然后提出一个改进算法,该算法不增加计算的复杂性,显著改进文档的聚类结果.最后,将该改进算法作为局部搜索过程嵌入到迭代局部搜索结构中,构造一个基于K中心点的迭代局部搜索文档聚类算法,进一步改进了文档聚类结果.试验结果表明该算法显著改进了文档聚类结果.  相似文献   

11.
目的利用粒子群优化算法和K-均值方法研究彩色图像的量化问题。方法针对K-均值聚类量化算法对初始值比较敏感,易陷入局部极小值从而使得算法得不到全局最优解,为局部搜索算法,以及粒子群优化算法是一种全局寻优方法的特征,把K-均值聚类方法和粒子群优化算法结合起来,将K-均值聚类方法中的聚类函数作为粒子群优化算法中的粒子适应度函数,对彩色图像进行聚类量化。结果实验表明新算法在峰值信噪比和均方根误差评判准则下可以得到更好的量化结果。结论新方法有效地克服了K-均值聚类方法和粒子群优化算法的不足。  相似文献   

12.
一种基于图像内容的自适应色彩量化算法   总被引:1,自引:0,他引:1  
色彩量化是数字图像分析与处理领域的基本问题之一.笔者以K-均值聚类为基础,提出了一种新的自适应色彩量化算法,该算法首先依据图像内容确定初始聚类中心,并对所有像素进行归类处理;再结合图像局部区域平滑度,修改聚类中心颜色;最后对所有聚类进行分裂和合并运算,并生成量化图像.实验结果表明,该算法具有较好的色彩量化效果(即色彩量化误差较小),整体性能优于K-均值聚类色彩量化方案.  相似文献   

13.
在计算机上,同屏显示多幅彩色图像会出现明显的失真(即色彩损失).特别是两幅图像色调差别较大时(如一幅暖色调,一幅冷色调),失真现象更为严重.为了克服这一缺陷.本文在参考K均值聚类算法的基础上,优化了初始聚类中心,提出了色彩压缩的聚类统计算法.本算法简单实现较为方便,克服了K均值算法对色彩压缩不均衡及彩色失真度大的缺点.且不需经过多次迭代即可得到令人满意的效果,压缩时间短.  相似文献   

14.
K-means聚类算法简单,收敛速度快,但是聚类算法的结果很容易受到初始聚类种群的影响,往往导致局部最优。差分进化算法具有很强的全局收敛能力和鲁棒性,但其收敛速度较慢。为此,将K-means聚类算法和差分进化算法相结合,提出一种基于K-means的改进差分进化聚类算法。该算法设置在一定范围内随迭代次数动态增加的交叉算子,以使算法在迭代过程中先进行全局搜索,再进行局部搜索,这样有助于平衡算法的全局寻优和局部搜索能力,并且加快了算法的收敛速度。最后,通过实验测试了算法的有效性。  相似文献   

15.
颜色量化是数字图像处理的基本技术之一,传统的量化算法有分割法和聚类法。本文提出了一种结合分割法和聚类法特点的自适应颜色量化算法,实验结果表明,在量化质量上本算法接近K-均值聚类法,但在运行效率上十分接近中位切分法,是一种相对高质高效的颜色量化算法。  相似文献   

16.
在运用聚类的思想对云资源进行分类时,资源属性的信息熵能反映资源属性在聚类过程中的重要程度。将信息熵的思想运用到K—mean聚类中,提出基于QK—mean聚类的任务调度算法,即对云资源按照属性的重要程度逐一进行K—mean聚类,把任务的调度过程转化成在资源K叉树中查找合适的“叶子”节点的过程。实验证明,该任务调度算法能够有效提高云任务调度的效率。  相似文献   

17.
陶涛  毛伊敏 《科学技术与工程》2021,21(21):8989-8998
针对大数据背景下基于划分的聚类算法中存在参数寻优能力不佳、初始中心敏感、数据倾斜等问题,提出一种基于MapReduce和人工蜂群(artificial bee colony,ABC)算法的并行划分聚类(the partitioning-based clustering algorithm by using im-prove artificial bee colony based on MapReduce,MR-PBIABC)算法.首先,提出基于反向学习和聚类准则函数的初始化策略(backward learning and the clustering criterion function,BLCCF),提升人工蜂群算法搜索的解质量,并将ABC算法和人工鱼群(artificial fish colony,AFS)算法结合,提出改进人工蜂群(improve artificial bee colony,IABC)算法,通过利用AFS算法最优解能力较强的特性,来提高ABC算法的寻优能力;其次,根据改进的人工蜂群算法IABC获取初始聚类中心,提出相对熵策略(rela-tive entropy strategy,RES)衡量人工鱼间的距离,保证获得的初始聚类中心是最优人工鱼状态,从而有效避免了随机选取初始聚类中心,引起的初始中心敏感的问题;再次,设计数据均衡策略(data balancing strategy,DBS),通过动态收集节点负载并分配节点间的负载,解决了节点上数据倾斜的问题;最后,结合MapReduce计算模型,并行挖掘簇中心,生成最终聚类结果.实验结果表明,MR-PBIABC算法的聚类效果更佳,同时在大数据环境下,能有效地提高并行计算的效率.  相似文献   

18.
黄欣  余思东  赵志刚 《广西科学》2020,27(1):104-109
针对车载自组织网(Vehicular Ad Hoc Networks,VANETs)拓扑结构经常变化导致通信链路容易断裂而通信质量不可靠的问题,将人工蜂与K-means混合算法应用在VANETs中。在成簇阶段,该混合算法利用人工蜂算法较强的全局搜索能力确定初始聚类中心,代替传统的K-means对初始聚类中心的选择,这样就消除了K-means对随机初始聚类中心的依赖。在簇头选取阶段,类内具有最小的速度方差以及到其他节点最小平均距离的车辆节点被选择为簇头。在簇的维护阶段,当最优节点即簇头有变化时,次优节点被选为临时簇头,直至更新为最优节点的簇头信息。为测试该混合算法的性能,将其和PSO与K-means混合算法、经典K-means算法进行实验对比,结果表明,该混合算法能够更加稳定VANETs通信链路,具有更高成簇质量和更高通信质量。  相似文献   

19.
针对海量数据聚类过程中,经典的K-均值聚类算法对其K个初始聚类中心点的选择以及数据集噪声十分敏感的问题,提出了一种针对海量数据考虑初始聚类中心点选择的聚类算法.该算法首先采用冒泡排序法对数据集进行排序,获取数据集的各维中心值组成第一个初始聚类中心点.其次,通过计算与第一个初始聚类中心点的欧式距离,对剩余候选初始聚类中心点进行优化选择,保证所有的聚类中心点均匀地分布在数据集密度较大的空间上,以此减少聚类过程中的迭代次数和提高聚类算法效率.最后,基于UCI(University of California,Irvine)中多个数据集,进行聚类算法对比实验.结果表明,在不降低聚类效果的前提下,该聚类算法的迭代次数平均降低到50%,所需的时间降低平均达10%,由实验结果还能推出,当点集的数目越多时,该算法就能表现出越明显的聚类优势效果.  相似文献   

20.
Fire statistics and fire analysis have become important ways for us to understand the law of fire, prevent the occurrence of fire, and improve the ability to control fire. According to existing fire statistics, the weighted fire risk calculating method characterized by the number of fire occurrence, direct economic losses, and fire casualties was put forward. On the basis of this method, meanwhile having improved K-mean clustering arithmetic, this paper established fire risk K-mean clustering model, which could better resolve the automatic classifying problems towards fire risk. Fire risk cluster should be classified by the absolute distance of the target instead of the relative distance in the traditional cluster arithmetic. Finally, for applying the established model, this paper carried out fire risk clustering on fire statistics from January 2000 to December 2004 of Shenyang in China. This research would provide technical support for urban fire management.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号