首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 515 毫秒
1.
针对K均值聚类算法易陷入局部最小的缺点,提出了一种多种群协同进化的微粒群和K均值混合聚类算法,它将整个种群分解为多个子种群,各子种群独立进化,周期性地更新共享信息.同时将此算法与现有的基于遗传算法的K均值聚类算法进行了比较.实验结果证明,该算法能有效地克服传统的K均值算法易陷入局部极小值的缺点,同时全局收敛能力优于基于遗传算法的K均值聚类算法.  相似文献   

2.
基于K均值的带变异粒子群聚类算法   总被引:1,自引:0,他引:1  
针对K均值算法的搜索结果依赖于初始聚类中心以及粒子群算法早熟收敛的缺点,提出了一种基于K均值的带变异粒子群聚类算法.该算法通过粒子群算法来弥补K均值算法的不足,根据粒子的收敛情况判断K均值操作的时机,提高了搜索性能,并采用变异操作来跳出局部极值.分别用K均值算法、PSO-K均值算法和该算法对3种实际数据进行了聚类测试,...  相似文献   

3.
大矢量空间聚类的遗传k-均值算法   总被引:4,自引:0,他引:4  
基于遗传算法与k均值算法,提出了一种遗传k均值算法.该算法通过改进标准遗传操作和使用可变变异率,使其在大矢量空间聚类问题中表现良好的性能,克服了k均值聚类算法易于陷入局部最值和标准遗传交叉操作对聚类应用的不适应.为设计全局最优搜索方案提供了新思路  相似文献   

4.
基于遗传算法的模糊c-均值聚类算法   总被引:5,自引:0,他引:5  
基于误差平方和准则的模糊c-均值算法(FCM)是一种典型的动态聚类算法,其求解结果通常是局部最优解;当模糊集合之间的并、交、包含运算采用传统定义时,在模糊c-均值聚类结果中还会存在无意义的聚类集.研究表明采用遗传算法进行模糊c-均值聚类(Fuzzy c-means algorithm over genetic algorithm,GFCM)时,不仅能够消除无意义的聚类集,而且还在一定程度上避免模糊c-均值算法收敛到局部最优解,为此设计编码、选择、配对交叉、变异等步骤.测试数据实验表明采用GFCM算法的结果优于FCM算法.  相似文献   

5.
朱长江  柴秀丽 《科学技术与工程》2013,13(10):2863-2866,2870
模糊C-均值聚类算法是一种局部搜索算法,采用迭代的爬山技术,对初值敏感易陷入局部最小值。遗传算法是一种全局优化算法,能够克服模糊C-均值聚类算法陷入局部最小值的问题,但遗传算法收敛速度慢,易早熟。应用小生境思想对遗传算法进行了改进,以保护种群中基因的多样性,设计了基于最短距离的算术交叉算子、边界变异算子及双精英种子参与进化的策略。仿真实验结果表明,改进后的算法能够提高模糊聚类的收敛速度和聚类质量。  相似文献   

6.
为了提高数据挖掘的聚类准确度,提出了一种基于菌群优化的K均值(K-means)聚类算法.采用K均值算法建立数据聚类模型.根据聚类类别数设定多个聚类中心坐标.设定所属类别距离阈值,然后计算待聚类点和所有中心点距离来划分该聚类点的类别.根据参与聚类各节点和各自中心点的距离值建立适应度函数.引入菌群优化算法对K均值聚类过程进...  相似文献   

7.
针对指纹定位精度易受指纹数据K-means聚类预处理效果不佳、加权K近邻算法采用固定K值进行匹配定位精度差等问题,提出一种基于改进K-means聚类的自适应加权K近邻算法.算法在对指纹数据进行聚类计算过程中充分考虑参考点间接收信号强度值与实际物理坐标的双重影响,以避免参考点分类不明确;根据每个测试点的匹配参考点之间实际距离的均值和标准差设置阈值,动态选择K值.实验结果证明,改进K-means聚类的自适应加权K近邻算法相较于传统室内定位算法定位精度提高了44%,可为相关应用提供更精确的定位服务.  相似文献   

8.
该文将量子人工蜂群(Quantum artificial bee colony, QABC)算法用于K均值(K-means)聚类的类别中心点选择,优化K均值聚类算法,可有效解决因随机设置K均值中心点而导致聚类准确度不高的问题。该文设置K均值聚类类别数,并随机设置若干类别中心,采用人工蜂群(Artificial bee colony, ABC)算法优化类别中心点,根据待聚类样本点构建蜜蜂种群,并对蜂群个体位置采用量子比特表示。以样本点和中心点的距离的倒数作为ABC算法适应度,并将适应度值较高个体定义为蜜源。通过引领蜂在运动范围内的粗粒度遍历和跟随蜂的细粒度探索,不断搜寻适应度较高个体,并且更新蜜源,直至ABC算法稳定后确定较优蜜源位置为聚类中心。采用ABC优化得到的聚类中心进行K均值聚类。试验结果表明,通过合理设置ABC搜索边界,并引入蜂群位置的量子表示,可有效增强ABC对聚类中心的搜索精度。相比于常用聚类算法,QABC+K均值算法的聚类性能更优。  相似文献   

9.
基于改进GA的K-均值聚类算法   总被引:3,自引:0,他引:3  
利用遗传算法或免疫规划算法解决初始聚类中心是较好的方法,但容易出现局部早熟现象.为了克服以上缺点,借助免疫机制的优点,将免疫原理的选择操作机制引入遗传算法中,提出基于改进遗传的K-均值聚类算法,该方法结合K-均值算法的高效性和改进遗传算法的全局优化能力,较好地解决了聚类中心优化问题.试验结果表明,本算法能够有效改善聚类质量.  相似文献   

10.
针对传统模糊均值聚类算法存在的问题, 提出一种改进遗传算法优化模糊均值聚类中心的图像分割算法. 首先在标准遗传算法的交叉操作中引入方向因子, 使参与交叉的个体向最佳个体靠近, 加快算法的收敛速度, 并通过增强群体间的信息共享机制提高算法的全局搜索能力, 避免了早熟收敛, 改善了全局解的精度; 然后采用改进遗传算法选择模糊均值聚类算法的初始聚类中心, 实现图像分割; 最后采用仿真实验测试算法性能. 实验结果表明, 相对于传统模糊均值聚类算法及其他图像分割算法, 本文算法在分割正确率、 分割速度及鲁棒性上均更优.  相似文献   

11.
针对k-means算法对初始值敏感、易陷入局部极小值等缺点,结合遗传算法的思想,提出了一种基于遗传算法和k-means算法的混合聚类方法,为了测试该聚类算法的性能,用k-means 算法和改进的算法进行了1组实验,并对2种算法的聚类结果进行比较,实验结果表明算法能够有效地解决聚类问题.  相似文献   

12.
为解决传统 K-means 算法中因初始聚类中心选择不当而导致聚类结果陷入局部极值的问题, 采用蝙蝠算法搜寻 K-means 算法的初始聚类中心, 并将模拟退火的思想和基于排挤的小生境技术引入到蝙蝠算法中, 以克服原始蝙蝠算法存在后期收敛速度慢、 搜索力不强等问题。 同时, 通过测试函数验证了其有效性。 最后利用改进后的蝙蝠算法优化 K-means 算法的初始聚类中心, 并将该改进的算法与传统的 K-means 算法的聚类结果进行了对比。 实验结果表明, 改进后的算法的聚类性能比传统的 K-means 算法有很大提高。  相似文献   

13.
传统K-means 算法对于聚类初始点的选取和距离度量的计算异常敏感,因而很可能导致K-means 算法只能收敛得到局部最优解。为此,提出一种改进的K-means 算法,即K-means 聚类算法最优匹配算法,并进行了相关的算法实验分析。该改进算法首先对传统的K-means 聚类算法进行初始点的选取,并分析聚类结果。然后,分别从初始聚类中心的选择和距离算法的确定进行实验测试,引入轮廓系数评价聚类效果,分析实验结果可知,K-means 聚类算法最优匹配算法具有较好的稳定性和较高的聚类准确率。  相似文献   

14.
In the K-means clustering algorithm, each data point is uniquely placed into one category. The clustering quality is heavily dependent on the initial cluster centroid. Different initializations can yield varied results; local adjustment cannot save the clustering result from poor local optima. If there is an anomaly in a cluster, it will seriously affect the cluster mean value. The K-means clustering algorithm is only suitable for clusters with convex shapes. We therefore propose a novel clustering algorithm CARDBK—"centroid all rank distance(CARD)" which means that all centroids are sorted by distance value from one point and "BK" are the initials of "batch K-means"—in which one point not only modifies a cluster centroid nearest to this point but also modifies multiple clusters centroids adjacent to this point, and the degree of influence of a point on a cluster centroid depends on the distance value between this point and the other nearer cluster centroids. Experimental results showed that our CARDBK algorithm outperformed other algorithms when tested on a number of different data sets based on the following performance indexes: entropy, purity, F1 value, Rand index and normalized mutual information(NMI). Our algorithm manifested to be more stable, linearly scalable and faster.  相似文献   

15.
针对K-均值聚类算法存在的不足,提出了一种新的整合粒子群优化算法(PSO)和K-均值算法的聚类算法.在新算法中,首先结合使用粒子群优化算法和K-均值算法搜索全局最优解的位置,然后再用K-均值算法在全局最优解附近的局部空间内快速寻找最优聚类中心.通过对4个数据集的实验测试,将此算法与K-均值算法、基于粒子群的K-均值算法进行了比较.实验结果表明,新算法的聚类质量比后两个算法更优.  相似文献   

16.
针对室内定位聚类算法中的奇异值出现较多的场景,按照以往聚类算法大多将其删除或替代为聚类平均值,这往往使得奇异值附近的定位误差陡增。研究采集阶段接入点(acess point,AP)端加入嵌入式滤波处理单元,采用格拉布斯(Grubbs)准则处理采集的信号以减少检测奇异值;然后在定位运算中改进了K-means聚类算法。首先根据模型函数鉴别运算中产生的奇异值,将奇异值线性化处理后由支持向量机(sport vector machine,SVM)对于奇异点进行分类;再将其进行K-means聚类划分。在不剔除奇异值的情况下,使得定位区域中的参考点合理利用,从而提高了整体累计误差的置信水平。研究中将剔除奇异值的K-means聚类算法作为比较对象,实验中采用美国Signal Hound公司的SA44B型频谱仪测量接收机组成传感器网络,可以使得K-means聚类算法的定位精度提高11.3%,证明在实际定位应用中是很有效的。  相似文献   

17.
We propose a new clustering algorithm that assists the researchers to quickly and accurately analyze data. We call this algorithm Combined Density-based and Constraint-based Algorithm (CDC). CDC consists of two phases. In the first phase, CDC employs the idea of density-based clustering algorithm to split the original data into a number of fragmented clusters. At the same time, CDC cuts off the noises and outliers. In the second phase, CDC employs the concept of K-means clustering algorithm to select a greater cluster to be the center. Then, the greater cluster merges some smaller clusters which satisfy some constraint rules.Due to the merged clusters around the center cluster, the clustering results show high accu racy. Moreover, CDC reduces the calculations and speeds up the clustering process. In this paper, the accuracy of CDC is evaluated and compared with those of K-means, hierarchical clustering, and the genetic clustering algorithm (GCA)proposed in 2004. Experimental results show that CDC has better performance.  相似文献   

18.
基于SOFM网络的改进K-均值聚类算法   总被引:1,自引:0,他引:1  
针对传统的K-均值聚类算法中随机选取初始聚类中心的缺陷,提出一种改进的K-均值聚类算法,利用自组织特征映射网络(SOFM)自动获得初始聚类中心.实验结果表明,改进的K-均值聚类算法能有效改善聚类性能,提高聚类的准确率.  相似文献   

19.
梁卓灵  元昌安  覃晓 《广西科学》2020,27(6):616-621
为改善交通拥堵的情况,本文利用聚类分析方法对移动轨迹数据进行挖掘,识别居民出行的热点区域。传统的Ng-Jordan-Weiss (NJW)谱聚类算法常使用K-means聚类算法来实现最后的聚类操作,然而K-means聚类算法存在对初始值敏感、容易陷入局部最优的缺陷,影响对热点区域的挖掘结果。因此,本研究将方差优化初始中心的K-medoids聚类算法运用到谱聚类算法最后聚类阶段,提出基于方差优化谱聚类的热点区域挖掘算法(Hot Region Mining algorithm based on improved K-medoids Spectral Clustering,HRM-KSC),然后在真实的轨迹数据集上进行试验。试验结果发现,HRM-KSC算法聚类结果的轮廓系数更高,表明HRM-KSC算法改善了NJW谱聚类算法,提高了聚类质量。  相似文献   

20.
一种改进的基于密度和样本数量的K-means算法   总被引:1,自引:0,他引:1  
对原始K-means算法进行了研究,通过改进,算法能够自动找出合适的k值,并且最大限度的找出孤立点。首先,寻找样本容量的最大可能初始聚类数n。然后做样本圆,将样本圆等分为n份,依据样本点的位置将样本归属到相应的份里,对初始的n个类进行聚类。最后通过应用DBSCAN算法的小类合并策略将需要合并的小类进行了合并。为了测试改进算法的聚类性能,将改进后的算法源码放在新西兰怀卡托大学所开发的开源平台"weka"上,在多个数据集上与原始K-means算法进行了对比实验,验证了改进算法在聚类质量和聚类稳定性上都远优于原始K-means算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号