共查询到17条相似文献,搜索用时 62 毫秒
1.
针对模糊C均值(fuzzy C means, FCM)聚类算法没有考虑噪声样本点和样本数据的分布特征对聚类结果影响的不足,利用数据加权策略对FCM聚类算法进行改进。改进后的算法通过计算各样本点的密度值,将初始聚类中心限制在高密度样本点区域,并把样本点的密度值作为该点的权值,对聚类中心进行调整,突出高密度样本点在聚类中心调整中的影响力,从而达到提高聚类效果的目的。人造数据集和加州大学欧文分校(University of California Irvine, UCI)真实数据集的实验结果表明,在不提高时间复杂度的同时,与FCM算法相比,基于数据加权策略的FCM算法聚类的准确率更高。 相似文献
2.
广义均衡模糊C均值聚类算法 总被引:3,自引:2,他引:3
模糊C均值聚类(FCM)算法是一种快速有效的聚类算法,但它没有考虑各类样本容量的差异, 其最小化代价函数会导致聚类判决有利于少样本类.提出一种新的聚类算法—-广义均衡模糊C均值聚类, 通过对模糊C均值聚类最小化代价函数的改进,使得样本容量在聚类代价函数中发挥效用, 从而弱化了样本容量差异对聚类判决的干扰.讨论分析了该算法的性质,模糊隶属度的推导突破了FCM解析解的约束. 通过仿真实验,验证了所提出算法的有效性. 相似文献
3.
模糊C均值聚类算法的一种初始化方法 总被引:5,自引:1,他引:5
模糊C均值聚类算法(FCM)在图像处理和模式识别中有着广泛的应用,该算法实质上是一种局部搜索寻优方法,对初始值很敏感,容易陷入局部极小值。当聚类数比较多时,往往得不到满意的聚类结果。本文首先讨论了FCM算法初始化对聚类结果的影响,然后提出了一种基于形态处理的FCM初始化方法。这种方法不仅可以得到比较满意的聚类结果,而且可以自动确定聚类数。 相似文献
4.
用K均值算法进行文本聚类通常只能以局部最优结束,很难找到全局最优.文章提出了一种基于混沌社会演化算法的文本聚类新方法.在该方法中提出了认知主体在聚类中对范式继承的方式,在认知主体对范式的背叛中提出一种混沌变异算子.实验证明该方法不但能有效地提高文本聚类的效率而且能有效地提高文本聚类的精度. 相似文献
5.
基于改进的模糊C-均值的分级递减聚类算法 总被引:2,自引:0,他引:2
提出了基于改进的模糊C-均值的分级递减聚类算法,利用改进的模糊C-均值聚类算法寻找类中心,再自适应确定该类中心的隶属度阈值,将聚类进行分级处理,实现未知类数数据集的聚类。实验结果表明,本算法对未知类数、具有高斯分布的数据集具有聚类效果好、收敛快的特点,且对于类数较多的数据集,本算法也是一种快速聚类算法。 相似文献
6.
基于遗传优化的采样模糊C均值聚类算法 总被引:14,自引:0,他引:14
在数据挖掘领域,模糊C均值聚类法(FCM)在处理小量低维的数据挖掘时是有效的,但是面向数据库的数据挖掘经常要处理大量、高维的数据.在这种情况下,FCM算法在时间性能上难以令人满意.本文基于采样技术对FCM算法进行改进,以提高算法的时间性能,并利用遗传算法对聚类结果进行优化以保证聚类的质量,给出了一种新的基于遗传优化的采样模糊C均值聚类算法SFGO(SamplingFCMwithGeneticOptimization).仿真实验证明SFGO算法在大规模数据库的聚类挖掘中,在时间性能和聚类质量上都能获得较满意的结果. 相似文献
7.
一种使用支撑集的区域型模糊聚类算法 总被引:1,自引:0,他引:1
使用支撑集和模糊待分集的概念来描述数据集的分布。在此基础上提出了一种基于类别融合的区域型模糊聚类算法 (regionalfuzzyclusteringalgorithm ,RFCA) ,并就该模型的两个聚类参数 (δ和ε)对聚类性能的影响进行了分析。仿真结果表明 ,该算法有比常用的模糊C均值更好的聚类性能。 相似文献
8.
目前对全球导航卫星系统(global navigation satellite system, GNSS)三频组合观测值优选的研究,主要集中在全球定位系统(global positioning system, GPS)和北斗二号(beidou navigation satellite system, BDS-2)上,对BDS-3的研究相对较少。为克服以往聚类优选算法中存在的仅适用于类球形簇、聚类数目和初始聚类中心的确定主观性强、对离群点敏感、易陷于局部最优等不足,提出一种改进的核模糊C均值聚类算法,引入核函数与抑制离群点的新距离度量,基于多类广义核极化准则优化核参数,用改进爬山法确定聚类数目与初始聚类中心。然后,以模糊C均值聚类算法为对照进行了对比实验,在短、长两种基线下分别解算组合模糊度。通过对优选所得代表性组合的模糊度固定成功率进行对比分析,验证了该算法的可行性与算法改进的有效性。 相似文献
9.
10.
自适应特征熵权模糊C均值聚类算法的研究 总被引:1,自引:0,他引:1
特征权重算法对聚类效果有很大的影响,而传统的特征权重算法忽略了特征项在类间和类内的分布情况.因此,研究聚类后样本特征属性表现的有序性程度对聚类结果的影响,分析聚类后样本特征属性的分布情况,提出了一种自适应特征熵权模糊C均值聚类算法.该算法以聚类后的特征熵和信息增益作为准则调整特征权值,通过聚类与权重更新逐步迭代优化,直至获得最优的特征权值.实验表明,自适应特征熵权模糊C均值聚类算法能够有效地区分各个特征属性对聚类效果的重要程度;较于其它加权模糊C均值聚类算法,该算法能够得到更高的聚类准确率. 相似文献
11.
为提高自组织网络的聚类能力,提出一种基于Bloch球面旋转的量子自组织网络聚类算法.通过使样本数据作为量子比特相位,将样本映射为Bloch球面上的量子比特,将竞争层权值映射为Bloch球面上随机分布的量子比特;通过计算样本和权值的球面距离最小值,确定获胜节点;通过使获胜节点及其邻域节点在Bloch球面上向着样本旋转来调整这些权值,直到算法收敛.该方法的明显优势在于有较高的聚类精度.以鸢尾属植物样本聚类为例,实验结果表明,提出的方法明显优于传统自组织网络、K-均值聚类等算法. 相似文献
12.
13.
一种基于量子机制的分类属性数据模糊聚类算法 总被引:3,自引:0,他引:3
分类属性数据的样本间的分布不平衡、样本的分布与空间距离无关的特点与量子力学中粒子的分布状态由能量决定、粒子分布具有不平衡性的特点相似.基于此,参照量子聚类QC算法确定聚类中心的聚类策略,重写距离量子势能公式,定义相似性度量测度和相异性度量测度的新概念,提出了针对分类属性数据的量子聚类CQC算法,并对算法的聚类有效性进行了研究,通过同其它几个已有的算法的仿真实验比较,证明该算法是有效的、有一定的可扩展性,算法的一些性能优于已有的其它几个算法. 相似文献
14.
距离模糊是雷达系统中重频工作模式下必须考虑的问题,而多重频技术是解距离模糊常见的信号波形设计方案。一维聚类算法可根据雷达不同重频的测量视在距离稳健地求解目标不模糊距离,但一维聚类算法在排序效率和根据测距信噪比估计目标不模糊距离性能两方面存在不足。加权快速聚类距离解模糊算法首先提出快速聚类算法提高解模糊时的排序效率,继而采用加权方式提高目标不模糊距离的估计性能。快速聚类算法的仿真试验结果表明快速聚类算法解距离模糊是一种实用的快速解距离模糊算法。 相似文献
15.
基于距离修正的模糊C-球壳聚类算法 总被引:1,自引:0,他引:1
针对基于欧氏距离的模糊C球壳聚类算法,在隶属度的计算中存在的不合理性提出新算法。新算法通过修正数据到原型的距离,使隶属度的计算利用了原型的几何结构信息,提高了算法的收敛速度。 相似文献
16.
17.
基于属性加权的模糊K-Modes聚类算法 总被引:6,自引:3,他引:6
提出了一种基于属性加权的模糊K Modes算法。该算法假定不同属性对聚类结果有不同程度的影响 ,定义新的适应度函数 ,利用进化策略优化加权矩阵 ,以基于划分相似度的聚类精确度作为聚类结果的评价准则。实验表明 ,此算法具有较好的聚类效果 ,且属性加权矩阵反映了数据各个属性的重要程度 ,从而可以进行属性的提取和选择。 相似文献