首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 250 毫秒
1.
K-means初始聚类中心优化算法研究   总被引:2,自引:1,他引:1  
由于K-means算法对初始中心的依赖性而导致聚类结果可能陷入局部极小,而采用密度函数法的多中心聚类并结合小类合并运算的聚类结果明显优于K-means的聚类结果。该算法的每一次迭代都是倾向于发现超球面簇,尤其对于延伸状的不规则簇具有良好的聚类能力。  相似文献   

2.
《河南科学》2016,(3):348-351
传统K-means聚类算法中聚类初始中心点是随机确定的,实际聚类数据集中可能有孤立点,造成了每次聚类的结果不同,聚类质量不同,有时陷入局部优化状态.针对这些问题,研究者曾试图用距离法解决孤立点的判断和确定初始聚类中心.这种思路存在不科学性.因为孤立点不仅指远离其他点,同时它的周围点稀疏;另外,当数据量过大、数据特征值过多时,算法的运算量大,需要占用大量的计算机资源,运算速度过慢.对传统的K-means聚类算法进行研究,提出了基于密度参数和距离理论的初始聚类中心的确定和孤立点的判断,对传统的K-means聚类算法进行改进.  相似文献   

3.
一种改进的K-means聚类算法   总被引:1,自引:0,他引:1  
传统的K-means聚类算法对初始聚类中心的依赖程度很大,聚类结果会随聚类中心的选择不同波动很大,为了消除这种中心选择不确定性,提出一种改进的K-means聚类算法,从而有效地改善初始聚类中心点选择的随机性,提高聚类结果的稳定性.仿真实验结果表明,改进后的K-means聚类算法优于传统的算法.  相似文献   

4.
K-means聚类算法具有实现简单、普及性强的优势,但存在聚类中心选取随意性强的劣势.文章提出增加一个密度变量的方式来选出合理的初始聚类中心,通过对校园网上热点话题聚类分析的实验,检验出改进K-means聚类算法聚类效果好.  相似文献   

5.
K-means聚类算法是近年来数据挖掘学科的一个研究热点和重点,该算法是基于划分的聚类分析算法.目前这种算法在聚类分析中得到了广泛应用。本文将介绍K-means聚类算法的主要思想,及其优缺点。针对该算法经常陷入局部最优,以及对孤立点敏感等缺点,提出了一种基于模拟退火算法的方法对其进行优化,可以有效地防止该算法陷入局部最优的情况。  相似文献   

6.
介绍K-means聚类算法推导过程,并给出利用Python实现K-means算法的程序,以进行验证.  相似文献   

7.
K-means聚类算法研究   总被引:1,自引:0,他引:1  
K-means算法作为聚类分析算法,已被广泛地应用到诸多领域。本文研究了K-means算法的基本原理,并将其应用到高校学生入学信息分析中。高考学生入学的相关信息包含了大量重要的学习及其他方面的信息,对这些数据信息进行分析和研究,有助于教师对不同类别的学生进行不同方式的教学,做到因材施教。首先对学生的入学信息数据进行预处理,然后使用K-means算法,对学生信息进行分类评价;最后利用所获得的分类结果指导学生在大学期间的学习方向以及教师对学生的培养工作。  相似文献   

8.
K—means聚类算法的研究   总被引:5,自引:0,他引:5  
为解决原始K-means算法随机选取初始聚类中心对聚类结果的影响较大的不足,提出了改进算法.采取基于采样选取聚类中心距离的规则,进行多次选择决定最终的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响达到最小;同时,在选取初始聚类中心后,对初值进行数据标准化处理.将改进的K-means算法应用于销售行业,结果显示,改进后的算法比原始的算法在效率上得到了提高.  相似文献   

9.
针对原始K-means算法的一系列问题,提出一种基于半监督的K-means聚类改进算法,能够自动进行聚类,找出最优K值,并且最大限度地找出孤立点.首先根据样本集自身的特点,按照"类内尽可能相似"原则一步一步形成数据集,然后对数据集进行"去噪"与合并相似簇,最后,利用少量的标记信息指导和修正聚类结果.在UCI的多个数据集...  相似文献   

10.
原始的k-means算法是从样本点的集合中随机选取K个中心,这种选取具有盲目性和随意性,它在很大程度上决定了算法的有效性.为消除选取初始中心的盲目性,应充分利用已有数据样本点的信息.采取对数据进行预处理的方式来选取初始中心.实验证明新的初始点的选取不仅提高了算法的计算效率,也提高了算法最终确定的聚类的精度.  相似文献   

11.
一种改进的基于遗传算法的K均值聚类算法   总被引:2,自引:0,他引:2  
结合遗传算法和K均值聚类算法的优点,提出一种改进的基于遗传算法的K均值聚类算法.将遗传算法的编码方法、初始化、适应度函数、选择、交叉和变异等较好地应用于聚类问题,不仅解决了K均值聚类算法中K值难以确定、对初始值敏感以及遗传算法存在收敛性差和容易早熟的缺点,而且实现了聚类中心的优化选择、K值的自动学习和基因的自适应变异等...  相似文献   

12.
为解决传统 K-means 算法中因初始聚类中心选择不当而导致聚类结果陷入局部极值的问题, 采用蝙蝠算法搜寻 K-means 算法的初始聚类中心, 并将模拟退火的思想和基于排挤的小生境技术引入到蝙蝠算法中, 以克服原始蝙蝠算法存在后期收敛速度慢、 搜索力不强等问题。 同时, 通过测试函数验证了其有效性。 最后利用改进后的蝙蝠算法优化 K-means 算法的初始聚类中心, 并将该改进的算法与传统的 K-means 算法的聚类结果进行了对比。 实验结果表明, 改进后的算法的聚类性能比传统的 K-means 算法有很大提高。  相似文献   

13.
K-均值算法中聚类个数优化问题研究   总被引:5,自引:1,他引:5  
在传统的K-均值聚类算法中,聚类数K必须事先给定,然而,实际中K值很难被精确的确定,K值是否合理直接影响着K-均值算法的好坏。针对这个缺点,提出一种优化聚类数算法,根据聚类算法中类内相似度最大差异度最小和类间差异度最大相似度最小的基本原则,构建了距离评价函数F(S,K)作为最佳聚类数的检验函数,建立了相应的数学模型,并通过仿真实验进一步验证了新算法的有效性。  相似文献   

14.
基于K-means算法的RGB图像色彩聚类   总被引:1,自引:0,他引:1  
给出了一个利用K-means算法进行迭代聚类,并以聚类结果建立彩色图像调色板的算法。该算法在统计图像中各种颜色的RGB组合值出现次数的基础上,以聚类得到的256种颜色建立调色板,从而将BMP格式图像转换成GIF格式。实验表明,这种转换的色彩失真较小。  相似文献   

15.
面对日益激烈的竞争环境,不管是金融行业,还是电信行业,企业运营营销方式从大众化营销转为根据不同的用户群体需求提供的差异化营销,而差异化营销的关键因素就是用户有效细分。本文根据通信用户通话数据作为分析对象,通过采集相关特点人群呼入呼出次数、通话持续时长等数据比较筛选后得到相关特征,对用户通话数据进行聚类,以此获取具有良好电信特征的群体。然后在以上筛选基础上,结合用户数据,采用K-means算法挖掘出用户数据与相关工作业务之间存在的相关关联性结果。企业可以此类用户细分为指导,为用户提供更好的优质服务。  相似文献   

16.
基于改进K-均值聚类的图像分割算法研究   总被引:3,自引:0,他引:3  
为了实现彩色图像的准确分割,研究了在HLS颜色空间中基于优化初始中心的加权K-均值彩色图像聚类算法.首先对大样本的目标颜色进行数理统计,获取优化的初始聚类中心,从而实现准确分类和避免K-均值容易陷入局部最优的问题;然后在HLS颜色空间中引入加权欧氏距离来度量对象间的相关性,通过调整系数使对象不同的颜色属性内在特征得以充分利用.实验证明,该算法在保持K-均值聚类简洁、收敛速度快的同时能产生更好的聚类效果,实现彩色图像的快速准确分割.  相似文献   

17.
一个基于K-means的聚类算法的实现   总被引:9,自引:0,他引:9  
聚类算法作为数据挖掘中的一种分析方法,它能找到样本比较密集的部分,并且概括出样本相对比较集中的区域.分析了传统的聚类算法及局限性,讨论了一个基于K-mealls算法的实现过程,使得算法可处理存在孤立点的大文档集,得到最佳的聚类结果。  相似文献   

18.
基于2d-距离改进的K-means聚类算法研究   总被引:1,自引:0,他引:1  
为了解决原始K-means算法随机选取聚类中心对聚类结果产生较大影响的不足和孤立点的存在对聚类精度的破坏,以及两者之间的相互牵制性,采用基于2d-距离的DKC值来对原始样本数据集进行预处理以分辨孤立点,同时确定初始的聚类中心,达到消除两者相互影响的效果,使得聚类中心相对稳定,改进后的算法较原始的算法在准确度上得到了改进。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号