首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
对近年来k-means算法的研究现状与进展进行总结.首先对较有代表性的初始聚类中心改进的算法,从思想、关键技术和优缺点等方面进行分析.其次选用知名数据集对典型算法进行测试,主要从就同一个数据集不同改进算法的聚类情况进行对比分析,为聚类分析和数据挖掘等研究提供有益的参考.  相似文献   

2.
在相似数据聚类过程中,由于数据相似性过高,造成特征冗余干扰,使数据中心很难确定.该文提出了一种基于倾斜概率的有效聚类数学模型,在计算聚类中心的过程中引入倾斜概率计算数据均值.在数据特征存在较大一致性冗余干扰时,计算分配到同一类簇的概率并建立约束,把这种概率约束运用到数据的类间相似性特征聚类中,可以有效地确定相似特征的初始聚类中心.实验证明该文模型能合理地选择出初始聚类中心,改进分类数学模型的分类效果,与k均值聚类模型相比,聚类结果更加紧致,鲁棒性更强.  相似文献   

3.
Gustafson-Kessel(GK)聚类算法可以有效地搜索超椭球、平面和线型的数据类,但仍然存在对初始聚类中心较敏感、易于陷入局部最优的缺陷.为此,文中根据鱼群觅食与聚类的相似性,利用人工鱼群(AFS)算法对聚类中心进行初始化,提出了改进的G-K聚类算法,并利用人工数据集和IRIS数据集进行仿真研究.结果表明,文中算法能有效地发现数据集中的聚类结构,聚类效果优于GK聚类算法.  相似文献   

4.
聚类成员簇个数的选择对聚类集成的结果有显著影响,但目前尚无此方面的系统研究。因此,通过系统比较不同的簇个数选择方法,确定较优的聚类成员簇个数选择方法。首先对5种常见的簇个数设置方法及其性能进行分析与比较。结果表明,当簇个数k等于实际标签数k~*时,得到的聚类集成结果最好。进一步探索更优的簇个数设置方法,从k~*~2k~*中选取6个较短的区间作为簇个数的选取范围,并将聚类集成的结果与使用k~*得到的结果进行比较。在基准数据集上的实验结果表明,当聚类成员簇个数与真实标签数据集中的类数相等时,获得的聚类集成效果最好。  相似文献   

5.
模糊c-均值聚类算法(fuzzy C-means 简称FCM)和层次聚类算法是两种非常重要的聚类算法.由于FCM算法对初始聚类中心敏感,并且需要人为确定聚类类别数,这样收敛结果易陷入局部最优解.通过对这两种聚类算法的分析,首先对传统的凝聚层次聚类算法提出了改进,然后用改进的凝聚层次聚类算法得到最佳聚类数和初始聚类中心,最后用FCM算法进行再次聚类,以此得到更好的聚类结果并且减少了执行时间和迭代次数.  相似文献   

6.
K-均值算法中聚类个数优化问题研究   总被引:5,自引:1,他引:5  
在传统的K-均值聚类算法中,聚类数K必须事先给定,然而,实际中K值很难被精确的确定,K值是否合理直接影响着K-均值算法的好坏。针对这个缺点,提出一种优化聚类数算法,根据聚类算法中类内相似度最大差异度最小和类间差异度最大相似度最小的基本原则,构建了距离评价函数F(S,K)作为最佳聚类数的检验函数,建立了相应的数学模型,并通过仿真实验进一步验证了新算法的有效性。  相似文献   

7.
为解决传统 K-means 算法中因初始聚类中心选择不当而导致聚类结果陷入局部极值的问题, 采用蝙蝠算法搜寻 K-means 算法的初始聚类中心, 并将模拟退火的思想和基于排挤的小生境技术引入到蝙蝠算法中, 以克服原始蝙蝠算法存在后期收敛速度慢、 搜索力不强等问题。 同时, 通过测试函数验证了其有效性。 最后利用改进后的蝙蝠算法优化 K-means 算法的初始聚类中心, 并将该改进的算法与传统的 K-means 算法的聚类结果进行了对比。 实验结果表明, 改进后的算法的聚类性能比传统的 K-means 算法有很大提高。  相似文献   

8.
基于信息熵的符号属性精确赋权聚类方法   总被引:1,自引:1,他引:0  
对符号类型数据聚类时,一些常用算法通常随机选择初始聚类中心,然而随机选择的中心与实际类中心可能存在较大偏差,因此,会导致聚类迭代次数的增加及聚类精度上的不足。提出一种基于信息熵对符号属性进行赋权的新方法,新方法改进了以往提出的对象密度概念及计算方法,从而弥补了以往方法在计算对象密度时没有 区分每个属性在计算密度时的贡献度,从而可能选择密度大的边界点作为聚类中心,影响聚类效果的不足。提出的新方法优化了初始聚类中心的选择,一些高质量的聚类中心被选出用于聚类。最后通过Matlab编程实现新方法的聚类过程。实验显示,新方法聚类的结果在一些指标上要好于已有方法  相似文献   

9.
为了解决以欧氏距离作为相似性准则的传统模糊聚类算法对多维数据处理不利的问题,采用马氏距离代替欧氏距离,对基于马氏距离的模糊聚类算法进行优化研究,以增强基于马氏距离的模糊聚类算法的聚类效果和能力。通过构造启发式搜索与k-means算法结合的初始优化方法,利用可以自动调节最佳聚类数的有效性函数,提出了一种优化算法KM-FCM,并将此新算法与FCM,FCM-M,M-FCM聚类算法在3个标准数据集上进行了实验。结果表明,KM-FCM算法有效,聚类精度比FCM,FCM-M,M-FCM高,对高维数据聚类识别能力强,具有全局优化作用,并且聚类个数无需提前设定。新算法可为基于马氏距离的模糊聚类算法的优化提供参考。  相似文献   

10.
改进的基于层次聚类的模糊聚类算法   总被引:1,自引:1,他引:0  
针对FCM算法的缺陷,文章提出了一种基于层次聚类的模糊聚类算法(HFCM)。该算法采用凝聚的层次聚类方法,可快速地发现高度聚集的数据区域,并对这些高密度区域进一步进行分析与合并,通过评估函数的评估,找到最优的聚类方案。试验结果表明,该算法具有较高的分类精确度和较高的排除噪声的能力。  相似文献   

11.
针对经典k-means聚类算法的弊端进行一定程度上的改进,提出一种新的基于距离相等函数决定最佳聚类值的改进方法.实验采用两大类标准数据集来测试该算法,并和k-means算法的结果进行了比较,证实了该改进算法的有效性,解决了聚类数目k值的难确定性问题.  相似文献   

12.
确定无线传感器网络节点配置数目的一种方法   总被引:4,自引:0,他引:4  
网络节点的配置数目对无线传感器网络的使用寿命、目标检测性能及经济代价具有很大影响,是无线传感器网络设计的一个重点。从信号处理角度,基于一定的网络使用寿命及一定的检测概率要求。提出确定网络所需节点数目下限的一种方法,并对各种参数对网络性能的影响进行分析。  相似文献   

13.
多微处理机系统处理机数的一种选优方法   总被引:1,自引:0,他引:1  
姚继雄  朱燕子 《贵州科学》1999,17(2):100-104
通过对一个SIMD/MIMD型多微处理机系统PAX的体系结构和典型算法分析,得到一种确定最优处理梵数的方法,该方法因PAX广泛适应而具有普适性。  相似文献   

14.
子空间聚类是一种将搜索局部化在相关维上进行的聚类算法,它能有效地克服数据因维度过高引起的在全空间上聚类的困难.针对高维分类型数据,本文提出了一种自底向上的子空间层次聚类算法,该算法在全局范围内建立一个最相似线性表用来记录每个簇类与其最相似的簇类的相似度,在聚类过程中,选取最相似的簇类合并,并通过维护此线性表产生最相似的簇类.此算法在基于信息熵的意义上能够较准确地搜索簇类的子空间.通过Zoo和Soybean两个典型的分类型数据实验发现,相对于其它相关聚类算法,该算法在聚类的准确率和稳定性方面表现出较高的优越性.  相似文献   

15.
基于核方法的分类型属性数据集模糊聚类算法   总被引:1,自引:0,他引:1  
针对分类型属性数据的聚类问题.将核方法的思想推广到快速、高效率的模糊c-均值算法,构造了基于核函数的模糊核c-均值聚类算法.该算法通过使用经验核矩阵充分利用了数据间的“相异性”信息,并且避免了模糊k-modes算法中每次迭代均要直接计算类中心的缺点,提高了聚类的精确度和稳定性.同时该算法对模式(类中心)的初始值选择不敏感.时实际的线性可分的和线性不可分的分类型属性数据集的仿真实验证明了该算法的有效性.  相似文献   

16.
聚类布尔和分类数据   总被引:1,自引:0,他引:1  
提出了一种判别布和分类属性相似度的准则,并在此基础上提出了一种新的聚类的算法CAC,该算克服了传统聚类算法不适合聚类布尔和分类属性数据的缺点,实验表明CAC算法比传统的聚类算法有更好的聚类效果。  相似文献   

17.
Clustering categorical data, an integral part of data mining, has attracted much attention recently. In this paper, the authors formally define the categorical data clustering problem as an optimization problem from the viewpoint of cluster ensemble, and apply cluster ensemble approach for clustering categorical data. Experimental results on real datasets show that better clustering accuracy can be obtained by comparing with existing categorical data clustering algorithms.  相似文献   

18.
利用三坐标机测量工件时,首先要确定测量坐标系。本文提出了用优化法确定坐标轴方向和测量弧面分度凸轮,确定起始点位置的最佳逼近法的目标函数表达式。此方法具有实用价值,可供测量者参考。  相似文献   

19.
CMM测量中检测点数量和分布的规划方法   总被引:4,自引:0,他引:4  
分析了坐标测量机(CMM)中影响检测点数量和分布的因素,指出检测点数量及分布的确定不但与加工过程的工艺能力和要求达到的检测精度等因素有关,而且还与被测表面的实际形状有关.采用实验方法对检测自由曲面时检测点数量和分布的规划进行研究,给出了确定检测点数量和分布的经验数据.结果表明,按照给出的经验数据确定检测点,可以在相同的检测精度要求下减少检测点数量  相似文献   

20.
基于山峰聚类的聚类上限确定方法   总被引:1,自引:0,他引:1  
文章提出了一种基于山峰聚类的聚类上限检测方法,依靠山峰聚类确定聚类数目的上限,仿真试验表明,这种方法能将聚类上限确定在一个合理的范围之内,从而加快聚类的效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号