首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 70 毫秒
1.
基于矩阵特征值分析的模糊聚类有效性指标   总被引:1,自引:0,他引:1  
许多有效性指标已经被提出量化地估计和评价模糊聚类算法对于给定数据集的划分结果.但是由于不合理的结构和极大的时间耗费,迄今这些有效性指标几乎都无法满足应用的一般性需求.为此,提出一个基于Gerschgorin圆盘定律估计的聚类有效性指标来估计模糊聚类的类数.先由模糊聚类划分的结果得到一个相关性矩阵,接着求出该矩阵的所有特征值和特征向量,然后基于经典Gerschgorin圆盘定律估计最优的类数.为了检验提出的指标在模糊聚类中的有效性,把模糊聚类算法应用到带有不同特征的3个人工数据集和3个真实的数据集,并比较提出的指标和2个最常用的模糊聚类有效性指标.实验结果证明了所提出的有效性指标能够发现被聚类数据集的固有结构,从而得出更加准确的类数.  相似文献   

2.
为了研究基于马氏距离模糊聚类算法的有效性,首先对比分析了基于数据集模糊划分与几何结构的模糊聚类有效性指标,确定了将紧致度、分离度与清晰度结合的有效性研究方向,然后针对基于马氏距离的模糊聚类提出新的度量标准,构造有效性指标,最后结合算法在真实数据集上进行实验,结果表明新指标能准确识别马氏距离模糊聚类算法在多维数据上的最佳聚类数目。  相似文献   

3.
基因聚类结果的内部确认技术研究   总被引:3,自引:0,他引:3  
聚类分析是后基因组时代基因表达数据处理的主要技术之一.聚类确认是聚类分析过程中的必要环节,其目的是对聚类结果的质量和聚类算法的性能进行评估,有助于聚类结果的注释.选择有效的确认函数是正确评价聚类结果的前提.文中采用分层聚类、K-均值聚类和SOMs算法对标准基因表达数据集进行聚类分析,研究了Silhouette指数、Dunn's指数、Davies-Bouldin指数及FOM(Figure of merit)测量等内部确认函数在基因聚类分析中评价聚类结果质量的有效性.结果表明:Silhouette指数和FOM测量能较好地反映聚类算法的性能和聚类结果的质量,Dunn's指数因其对噪声的高度敏感性不能直接用于基因聚类结果的确认,Davies-Bouldin指数确认算法的能力好于Dunn's指数,但偏爱单连接聚类.上述研究结论将为基因聚类分析中聚类算法的评估与聚类结果的确认提供有价值的参考依据.  相似文献   

4.
基于硬聚类算法的几种有效性指标,即Hubert统计量、Davies—Bouldin指标、Dunn’S指标以及Dunn's指标的推广,提出了相应的适用于模糊聚类算法的有效性指标.实验证明,这些改进的有效性函数对模糊C-均值算法而言同样有效.  相似文献   

5.
针对绿色工艺评价样本具有不确定性、多维性以及量纲差异大的特点,为实现样本的合理分类,提出一种基于核的模糊可能性聚类新算法.该方法将核模糊聚类算法、可能性聚类算法和减法聚类算法相结合,以提高聚类的准确率;使用聚类有效性指标作为分类条件,自适应确定最佳分类数.仿真实验结果表明,该算法具有较好的有效性和鲁棒性,并将该算法运用在绿色工艺评价样本分类中,得到了较好的分类效果,验证了算法的实用性.  相似文献   

6.
一种改进的模糊C均值聚类算法   总被引:1,自引:1,他引:0  
由于现有模糊C-均值聚类算法固有的局限性,本文提出了一种改进的模糊C-均值聚类算法.首先用概率密度函数来确定初始聚类中心点和聚类数,其次用竞争学习思想提出使对手增加抑制因子来修改隶属度得到加快收敛速度的效果,最后提出用一个类内差异与类间差异兼备的新的有效性指标来作为迭代条件的目标函数.通过实验获取参数的最优取值范围,通过与经典模糊C-均值聚类算法的比较,证明了该改进算法不仅加快了收敛速度,而且在聚类结果的质量上有一定程度的提高.  相似文献   

7.
模糊c均值聚类算法(FCM)由于样本模糊隶属度归一性的约束,导致FCM算法对噪声数据敏感。提出松弛模糊C均值聚类算法(RFCM),RFCM算法在可能性c均值聚类算法(PCM)目标函数的基础上,放弃了FCM算法单个样本模糊隶属度归一化约束,转为n个样本模糊隶属度之和为n的约束,并利用粒子群算法对样本模糊隶属度进行优化估计,使得模糊指标可拓展为m>0的情况,同时采用梯度法得到RFCM算法聚类中心迭代公式。RFCM理论分析了算法对噪声数据抗噪的原理,解释了RFCM算法模糊指标m>0的合理性,讨论了RFCM算法的收敛性。基于gauss数据集和UCI数据集的仿真测试验证了所提出算法的有效性。  相似文献   

8.
【目的】在没有先验知识的前提下,采用基于粒子群优化算法(PSO)的加权模糊C-均值(WFCM)聚类算法,从30多万条记录的医疗保险数据中挖掘出疑似医疗保险欺诈的记录。【方法】首先,引用改进的欧式距离、相似性函数以及交叉熵函数并通过PSO算法极小化交叉熵函数,对属性权重进行分析;其次,选取Calinski-Harabasz(CH)有效性指标,展开聚类有效性的研究;然后,基于数据预处理的结果将数据运用于PSO算法,不断更新得到各属性的权重,并运用聚类有效性评价中的CH有效性指标来动态估计最佳聚类个数,提高FCM聚类的速度;最后,将属性权重和最佳聚类数应用于FCM聚类算法,根据隶属度矩阵聚类得到疑似医疗保险欺诈结果。【结果】基于上述研究方法,本研究根据最后的隶属度矩阵来进行聚类分析。【结论】将优化的权重应用于加权FCM聚类算法与聚类有效性评价,既提高了聚类算法的高效性,又避免了主观评价对分类的影响。  相似文献   

9.
为数据集选择合适的聚类算法是获得高质量聚类结果的前提和保障.提出了基于有效性指标的聚类算法选择方法,通过对不同聚类算法的聚类结果的质量评价为数据集选择最适合的聚类算法.该方法的优点是在对数据集的情况了解甚少的情况下,也能有效地保障聚类质量.实验结果表明本文方法十分有效,为实验数据集正确选择出最适合的聚类算法,并获得了高质量的聚类结果.  相似文献   

10.
一种确定最佳聚类数的新算法   总被引:1,自引:0,他引:1  
针对K-均值聚类算法需要事先确定聚类数K的问题,将粒度计算引入样本相似度函数,定义了新的样本相似度,用模糊等价聚类确定数据集可能的最大类簇数Kmax.以Kmax为搜索上界,利用改进全局K-均值聚类算法,以BWP(Between-Within Proportion)为聚类有效性度量指标,提出确定最佳聚类数的一种新方法.通过UCI机器学习数据库数据集以及随机生成的人工模拟数据集实验测试,证明该算法不仅能有效确定数据集的最佳聚类数,而且适用于大规模数据集,但是会受到噪音点影响.  相似文献   

11.
The collected spikes from extracellular recordings usually contain noisy data and outliers, which make it difficult to separate them. A method for spike sorting based on robust clustering is proposed to deal with the problem. The clustering method combines the advantage of fuzzy clustering and robust statistical estimators. The number of dusters is obtained by fuzzy cluster validity. In order to reduce the influence of outliers, the validity index is calculated using the weighting intra-cluster distances. The proposed method is suitable to separate neural spikes in the presence of noisy data and outfiers. The experiment on real data shows its performance.  相似文献   

12.
模糊熵描述了一个模糊集的模糊性程度.本文将模糊熵应用于聚类有效性的分析.指出用于聚类有效性判决的划分系数是一个基于模糊熵的聚类有效性判决准则.最后通过几组数据对不同模糊熵公式的判决功能进行了比较实验.  相似文献   

13.
李恒宾 《科学技术与工程》2012,12(21):5149-5153,5162
提出了一种模糊聚类、粗糙集理论与神经网络集成的混合智能故障诊断方法。引入聚类有效性函数和点分布密度函数。对模糊c-均值聚类算法进行改进,形成了自适应模糊聚类算法并依据该算法将连续的故障特征值离散化。应用粗糙集理论处理离散化的故障诊断数据。采用基于信息熵的方法,约简冗余的故障特征。依据约简结果构建神经网络,采用遗传算法优化网络的权值和阈值。将该方法用于柴油机气门故障诊断,并与普通神经网络进行对比。结果表明,该方法提高了故障诊断的正确率。  相似文献   

14.
针对数据集的聚类过程容易受到离群值的影响这一问题,提出了局部密度离群值检测k-means算法,即先对数据集使用局部密度离群值检测方法检测离群值,先把离群值去除,再进行k-means聚类,算法的有效性通过Davies-Bouldin指标(DB)、Dunn指标和Silhouette指标进行评价,在人工生成的数据集与UCI数据集上验证,去除离群值,再使用k-means算法得到的聚类结果相比原始数据集进行k-means算法聚类结果较好,并且用在疫情数据分析上,对安徽省、北京市、福建省、广东省等24个省、市、自治区2020年2月18日新型冠状病毒肺炎确诊人数进行聚类分析,得到的去除离群值在使用k-means算法相比原始数据集进行k-means算法聚类结果较好,该结果能帮助更好地在实际中怎么去做决策以及更好地降低经济损失。  相似文献   

15.
基于模糊聚类方法的T-S模糊系统建模   总被引:4,自引:0,他引:4  
提出了用一个聚类验证准则设计模糊C均值聚类算法,这个聚类验证准则是用来确定模糊C均值算法中合适的聚类数.针对T—S模糊模型,由模糊c均值聚类算法确定其逻辑前件参数,进而采用最小二乘算法确定模糊推理规则的后件参数.最后,应用本文建模方法对一个非线性实例进行仿真计算,并与其它方法进行了比较,结果表明本文方法是有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号