首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
K-means聚类算法是近年来数据挖掘学科的一个研究热点和重点,该算法是基于划分的聚类分析算法.目前这种算法在聚类分析中得到了广泛应用。本文将介绍K-means聚类算法的主要思想,及其优缺点。针对该算法经常陷入局部最优,以及对孤立点敏感等缺点,提出了一种基于模拟退火算法的方法对其进行优化,可以有效地防止该算法陷入局部最优的情况。  相似文献   

2.
一种改进的K-means聚类算法   总被引:1,自引:0,他引:1  
传统的K-means聚类算法对初始聚类中心的依赖程度很大,聚类结果会随聚类中心的选择不同波动很大,为了消除这种中心选择不确定性,提出一种改进的K-means聚类算法,从而有效地改善初始聚类中心点选择的随机性,提高聚类结果的稳定性.仿真实验结果表明,改进后的K-means聚类算法优于传统的算法.  相似文献   

3.
传统K-means 算法对于聚类初始点的选取和距离度量的计算异常敏感,因而很可能导致K-means 算法只能收敛得到局部最优解。为此,提出一种改进的K-means 算法,即K-means 聚类算法最优匹配算法,并进行了相关的算法实验分析。该改进算法首先对传统的K-means 聚类算法进行初始点的选取,并分析聚类结果。然后,分别从初始聚类中心的选择和距离算法的确定进行实验测试,引入轮廓系数评价聚类效果,分析实验结果可知,K-means 聚类算法最优匹配算法具有较好的稳定性和较高的聚类准确率。  相似文献   

4.
介绍K-means聚类算法推导过程,并给出利用Python实现K-means算法的程序,以进行验证.  相似文献   

5.
针对原始K-means算法的一系列问题,提出一种基于半监督的K-means聚类改进算法,能够自动进行聚类,找出最优K值,并且最大限度地找出孤立点.首先根据样本集自身的特点,按照"类内尽可能相似"原则一步一步形成数据集,然后对数据集进行"去噪"与合并相似簇,最后,利用少量的标记信息指导和修正聚类结果.在UCI的多个数据集...  相似文献   

6.
《河南科学》2016,(3):348-351
传统K-means聚类算法中聚类初始中心点是随机确定的,实际聚类数据集中可能有孤立点,造成了每次聚类的结果不同,聚类质量不同,有时陷入局部优化状态.针对这些问题,研究者曾试图用距离法解决孤立点的判断和确定初始聚类中心.这种思路存在不科学性.因为孤立点不仅指远离其他点,同时它的周围点稀疏;另外,当数据量过大、数据特征值过多时,算法的运算量大,需要占用大量的计算机资源,运算速度过慢.对传统的K-means聚类算法进行研究,提出了基于密度参数和距离理论的初始聚类中心的确定和孤立点的判断,对传统的K-means聚类算法进行改进.  相似文献   

7.
在计算机上,同屏显示多幅彩色图像会出现明显的失真(即色彩损失).特别是两幅图像色调差别较大时(如一幅暖色调,一幅冷色调),失真现象更为严重.为了克服这一缺陷.本文在参考K均值聚类算法的基础上,优化了初始聚类中心,提出了色彩压缩的聚类统计算法.本算法简单实现较为方便,克服了K均值算法对色彩压缩不均衡及彩色失真度大的缺点.且不需经过多次迭代即可得到令人满意的效果,压缩时间短.  相似文献   

8.
基于信息熵改进的 K-means 动态聚类算法   总被引:3,自引:2,他引:1  
初始聚类中心及聚类过程产生的冗余信息是影响K-means算法聚类性能的主要因素,也是阻碍该算法性能提升的主要问题.因此,提出一个改进的K-means算法.改进算法通过采用信息熵对聚类对象进行赋权来修正聚类对象间的距离函数,并利用初始聚类的赋权函数选出质量较高的初始聚类中心点;然后,为算法的终止条件设定标准阈值来减少算法迭代次数,从而减少学习时间;最后,通过删除由信息动态变化而产生的冗余信息来减少动态聚类过程中的干扰,以使算法达到更准确更高效的聚类效果.实验结果表明,当数据样本数量较多时,相比于传统的K-means算法和其他改进的K-means算法,提出的算法在准确率和执行效率上都有较大提升.  相似文献   

9.
K-means聚类算法研究   总被引:1,自引:0,他引:1  
K-means算法作为聚类分析算法,已被广泛地应用到诸多领域。本文研究了K-means算法的基本原理,并将其应用到高校学生入学信息分析中。高考学生入学的相关信息包含了大量重要的学习及其他方面的信息,对这些数据信息进行分析和研究,有助于教师对不同类别的学生进行不同方式的教学,做到因材施教。首先对学生的入学信息数据进行预处理,然后使用K-means算法,对学生信息进行分类评价;最后利用所获得的分类结果指导学生在大学期间的学习方向以及教师对学生的培养工作。  相似文献   

10.
孙震 《科学技术与工程》2012,12(8):1790-1794
近来自然图像的修复已经成了一个热门话题.提出了一种基于K-means聚类算法的自组织神经网络(SOM),称为SOM-K.它首先利用SOM来训练每一个像素的特征向量,并把一幅图像分层.这样就能把每个破损像素分到每层,同时SOM训练后的输出也通过K-means聚类算法来聚合,分别在各个层中修复破损的像素.最后把修复好的各层溶合到一起.与单独使用SOM相比,SOM-K具有更精确的分类能力.  相似文献   

11.
基于改进K-均值聚类的图像分割算法研究   总被引:3,自引:0,他引:3  
为了实现彩色图像的准确分割,研究了在HLS颜色空间中基于优化初始中心的加权K-均值彩色图像聚类算法.首先对大样本的目标颜色进行数理统计,获取优化的初始聚类中心,从而实现准确分类和避免K-均值容易陷入局部最优的问题;然后在HLS颜色空间中引入加权欧氏距离来度量对象间的相关性,通过调整系数使对象不同的颜色属性内在特征得以充分利用.实验证明,该算法在保持K-均值聚类简洁、收敛速度快的同时能产生更好的聚类效果,实现彩色图像的快速准确分割.  相似文献   

12.
一种改进的基于遗传算法的K均值聚类算法   总被引:2,自引:0,他引:2  
结合遗传算法和K均值聚类算法的优点,提出一种改进的基于遗传算法的K均值聚类算法.将遗传算法的编码方法、初始化、适应度函数、选择、交叉和变异等较好地应用于聚类问题,不仅解决了K均值聚类算法中K值难以确定、对初始值敏感以及遗传算法存在收敛性差和容易早熟的缺点,而且实现了聚类中心的优化选择、K值的自动学习和基因的自适应变异等...  相似文献   

13.
K均值算法利用K个聚类的均值作为聚类中心,通过对比样本到各聚类中心的距离,将样本划分到距离最近的聚类中,从而实现样本的聚类.分析了K均值算法的基本原理和实现步骤,并将其应用于数据聚类和图像分割,取得了较好的聚类效果.最后,针对K均值算法的不足之处,提出了改进措施,提高了K均值算法的聚类性能.  相似文献   

14.
一个基于K-means的聚类算法的实现   总被引:9,自引:0,他引:9  
聚类算法作为数据挖掘中的一种分析方法,它能找到样本比较密集的部分,并且概括出样本相对比较集中的区域.分析了传统的聚类算法及局限性,讨论了一个基于K-mealls算法的实现过程,使得算法可处理存在孤立点的大文档集,得到最佳的聚类结果。  相似文献   

15.
传统K-means聚类算法通过欧式距离计算样本的相似度,将数据所有的属性特征均平等对待,忽略每个属性特征的不同贡献,导致样本相似度计算的准确率不高.针对这个不足,提出一种特征加权的K-means算法进行优化.首先,运用Softmax和Sigmoid逻辑回归函数计算特征权重,使得加权的欧式距离更能准确地表示样本相似度;其...  相似文献   

16.
K-means聚类算法简单,收敛速度快,但是聚类算法的结果很容易受到初始聚类种群的影响,往往导致局部最优。差分进化算法具有很强的全局收敛能力和鲁棒性,但其收敛速度较慢。为此,将K-means聚类算法和差分进化算法相结合,提出一种基于K-means的改进差分进化聚类算法。该算法设置在一定范围内随迭代次数动态增加的交叉算子,以使算法在迭代过程中先进行全局搜索,再进行局部搜索,这样有助于平衡算法的全局寻优和局部搜索能力,并且加快了算法的收敛速度。最后,通过实验测试了算法的有效性。  相似文献   

17.
为解决传统 K-means 算法中因初始聚类中心选择不当而导致聚类结果陷入局部极值的问题, 采用蝙蝠算法搜寻 K-means 算法的初始聚类中心, 并将模拟退火的思想和基于排挤的小生境技术引入到蝙蝠算法中, 以克服原始蝙蝠算法存在后期收敛速度慢、 搜索力不强等问题。 同时, 通过测试函数验证了其有效性。 最后利用改进后的蝙蝠算法优化 K-means 算法的初始聚类中心, 并将该改进的算法与传统的 K-means 算法的聚类结果进行了对比。 实验结果表明, 改进后的算法的聚类性能比传统的 K-means 算法有很大提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号