首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
【目的】聚类是数据分析和数据挖掘技术中最重要的概念,其中,k-均值聚类算法是最常用的方法之一。然而,k-均值聚类算法高度依赖于初值,容易陷入局部最优解。为了克服k-均值聚类算法存在的不足,【方法】本研究提出一种利用多元宇宙算法(MVO)解决聚类分析问题的新算法,并进行一些数据集测试实验。【结果】数值模拟实验表明多元宇宙算法解决聚类问题效果优于人工蜂群(ABC)算法,布谷鸟搜索(CS)算法、粒子群优化(PSO)算法等。【结论】在大多数测试数据集的情况下多元宇宙算法解决聚类分析问题具有收敛速度快、聚类精度高和稳定性好的优点。  相似文献   

2.
聚类分析是模式识别的一个重要分支,以核心点和k-均值算法为基础,提出了一种基于参考点的快速k-均值算法;本算法以参考点作为第一个初始聚类中心,剩余初始聚类中心在核心点中选取,使得初始聚类中心能更好的反映模式样本集的几何特征,并且能减少迭代次数.  相似文献   

3.
通过将粗糙集和模糊聚类算法相结合, 利用粗糙集中上近似集和下近似集的概念改进模糊聚类算法, 解决了模糊聚类边界不确定的问题, 得到了上近似集和下近似集的聚类结果, 从而实现更好的聚类, 改进算法可以处理边界问题和复杂数据问题. 将改进的粗糙集模糊聚类算法用于研究环糊精聚类, 并将聚类结果与K均值聚类分析算法、 模糊C均值聚类算法相比, 实验结果表明, 改进算法有较好的聚类效果.  相似文献   

4.
[目的]直接利用模糊C均值(FCM)对原始数据进行聚类,容易导致聚类结果受到噪声和离群点的影响,但通常利用松弛技术对样本点模糊隶属度或空间位置关系进行松弛的解决方法只能降低,而无法完全剔除噪声和离群点的影响.为了解决这个问题,提出了基于截断技术的鲁棒模糊C均值(TRFCM)聚类算法.[方法]基于模糊局部信息C均值(FLICM)聚类模型,通过引入截断技术,提出TRFCM算法.该算法的主要思路为:(1)利用FLICM,在学习数据聚类结构的同时保留样本点的局部邻域结构;(2)基于FLICM的聚类结果动态调整原始数据,使其满足期望的聚类结构;(3)将聚类结构特征学习与原始数据的调整(即截断掉部分样本点),统一在一个优化框架中,从而实现组合最优化.将TRFCM算法与近年来相关算法进行比较以检验TRFCM的参数敏感性、收敛性、鲁棒性、时效性等性能.[结果]实验包括5个部分:参数敏感性与收敛性分析、鲁棒性检验、图像分割实验、Benchmark数据集实验和各算法计算时间对比实验.在参数敏感性和收敛性分析中,TRFCM算法在合适的范围内对参数不敏感且在大多数情况下可以获得良好的聚类效果.同时,算法对各数...  相似文献   

5.
针对红斑鳞状皮肤病鉴别诊断难题,提出利用聚类分析进行诊断;采用3种k-均值、2种k-中心点、最小生成树以及密度峰值点快速搜索聚类算法对该疾病数据进行分析,比较各算法对该疾病的聚类误差平方和、聚类结果 Rand指数、Jaccard系数、调整Rand指数以及聚类准确率;比较各算法对预处理的数据子集的聚类结果与文献中采用k-均值算法对未预处理的该数据子集的聚类结果。结果表明:邻域k-中心点算法对红斑鳞状皮肤病有很好的聚类效果,聚类准确率、聚类结果 Rand指数、Jaccard系数、调整Rand指数均优于对比算法,密度全局k-均值算法的聚类效果次之,全局k-均值算法取得最佳聚类误差平方和;k-均值算法对预处理数据子集的聚类准确率最高,邻域k-中心点与密度全局k-均值算法的聚类准确率相等;数据预处理可提高k-均值算法对该疾病的诊断准确率。  相似文献   

6.
为解决k-means聚类算法和k-凝聚聚类算法对于非凸形状数据聚类正确率低和模糊核聚类算法(FKCM)收敛速度慢的问题,将k-凝聚聚类算法与核函数方法相结合,在高维特征空间构造了新的核聚类算法--核k-凝聚聚类算法,实现了k-凝聚聚类算法的核化.通过Matlab编程进行数值实验,证明了核k-凝聚聚类算法在聚类的准确性、稳定性、健壮性等方面较之k-means聚类算法、k-凝聚聚类算法和FKCM有一定程度的改进.  相似文献   

7.
子空间聚类已经广泛应用于多个涉及高维数据聚类应用领域,受到机器学习研究者的广泛关注.子空间聚类方法是一种使用特征选择的聚类分析技术,通过选择重要特征子集实现对高维空间的低维表示,在实际应用中能够取得更好的性能,成为流行的高维数据聚类方法.与硬聚类方法相比,软聚类能够给出复杂数据更有意义的划分.扩展k-均值聚类并提出基于可靠性的正则化加权软k-均值新的子空间聚类方法(Reliability-based regularized weighted soft k-means clustering algorithm,RRWSKM),该方法能够计算每个特征对每个聚类的贡献度,从而找到与不同聚类相关的重要特征子集.另外,该方法能够通过调整模型参数准确地辨识数据模式,具有良好的聚类性能.该方法把维度加权熵和划分熵作为正则化项引入到目标函数,避免过拟合问题同时使更多的特征参与辨识聚类.为了提高算法的鲁棒性,使用可靠性测度获得特征权重初始值,提高算法的可靠性和性能.考虑到该算法是非凸优化问题,使用迭代优化方法得到优化问题的最优解.使用多个实际数据集对本文算法进行仿真验证,结果表明,与其他子空间聚类算法相比,该算法能够有效发现高维数据的低维表示,具有良好的聚类性能,适合高维数据的聚类.  相似文献   

8.
基因聚类结果的内部确认技术研究   总被引:3,自引:0,他引:3  
聚类分析是后基因组时代基因表达数据处理的主要技术之一.聚类确认是聚类分析过程中的必要环节,其目的是对聚类结果的质量和聚类算法的性能进行评估,有助于聚类结果的注释.选择有效的确认函数是正确评价聚类结果的前提.文中采用分层聚类、K-均值聚类和SOMs算法对标准基因表达数据集进行聚类分析,研究了Silhouette指数、Dunn's指数、Davies-Bouldin指数及FOM(Figure of merit)测量等内部确认函数在基因聚类分析中评价聚类结果质量的有效性.结果表明:Silhouette指数和FOM测量能较好地反映聚类算法的性能和聚类结果的质量,Dunn's指数因其对噪声的高度敏感性不能直接用于基因聚类结果的确认,Davies-Bouldin指数确认算法的能力好于Dunn's指数,但偏爱单连接聚类.上述研究结论将为基因聚类分析中聚类算法的评估与聚类结果的确认提供有价值的参考依据.  相似文献   

9.
为解决高多元时间序列聚类算法的问题,采用了一种基于主元分析方法的多元时间序列聚类分析方法,利用MTS序列的前z个主元与每个簇的代表元素之间的Eros距离,将原有的复杂数据降维.在此基础上通过改进K-means算法对选取的多元时间序列的主元进行聚类分析,最后得到K个MTS聚类.理论分析和实验结果表明该算法能有效解决聚类问题.  相似文献   

10.
模糊C均值(FCM)聚类是一种常用的聚类方法,在工业应用时,常因数据的强噪声和非线性导致聚类效果不够理想。提出了一种密度加权、核理论和可能性模糊C均值聚类(PFCM)相结合的聚类方法。该方法采用核函数,将数据映射到线性空间进行聚类分析,消除非线性影响;通过引入点密度概念,加快算法迭代,增强可分性,提高聚类准确率。将该聚类算法用于污水处理过程的故障检测,结果表明该方法不仅能解决非线性问题,而且能有效加快收敛速度。  相似文献   

11.
在θ阶正规齐型空间上 ,设算子列 {Sk}k∈ Z是恒等逼近 ,记 Dk =Sk- Sk-1,DNk =∑| j| 相似文献   

12.
某第二类Fredholm积分方程的一种数值解法   总被引:1,自引:0,他引:1  
我们考虑第二类 Fredholm积分方程的快速数值解法 .本文假设核函数除在 x=t处带有弱奇性外 ,是解析的 [1] .我们利用分片多项式插值逼近核函数 ,由此得到近似的系数矩阵 A.设 n为积分节点的个数 ,k2为每个小区域的插值节点数 ,我们证明矩阵 A的计算和矩阵 -向量相乘 Ax各需要 O( nk)次运算 ,存贮 A需要占用 O( nk)内存 .最后我们对算法的稳定性进行讨论并给出数值结果  相似文献   

13.
 研究涉及微分多项式分担集合的亚纯函数的正规性问题。设k≥2是正整数,F为区域D的一族亚纯函数, 其所有零点重级至少为k;a,b和c是复数,且a≠b,c≠0。如果对于F中的任意一对函数f(z)和g(z),有f与g分担c, 且L(f)与L(g)分担集合S={a,b}, 则F在D内正规。  相似文献   

14.
 设G为有限群,H是G的子群。称H是G的S-拟正规子群,如果对G的任意Sylow 子群P,有HP=PH;称H是G的S-拟正规嵌入子群,若H的Sylow子群为G的某个S-拟正规子群的Sylow子群;称H是G的C*-正规子群,如果G有正规子群K使得G=HK且满足H∩K在G中是S-拟正规嵌入的。设d是p-群P的最小生成元个数。考虑P的d个极大子群构成的集合Μd(P)={P1,…,Pd}且使得它们的交是P的Frattini子群Φ(P)。对Μd(P)中的群在满足C*-正规假设条件下群的结构进行了研究,并推广了最近的一些结论。  相似文献   

15.
针对常规动态聚类方法对初始聚类中心的敏感性和容易陷入局部最优的缺点等问题,提出了基于二阶段微粒群优化模糊C-均值算法(TPSOFCM),并将此算法与现有的模糊C-均值聚类算法和基于多阶段的模糊C-均值算法进行比较。该算法对Iris数据进行聚类,计算结果表明:该算法有较好的全局收敛性,不仅能有效地克服传统的模糊C-均值算法易陷入局部最优解的缺点,而且全局收敛能力优于模糊C-均值聚类算法和基于多阶段的模糊C-均值算法。  相似文献   

16.
为了解决LVQ神经网络在应用时对初始权值敏感的问题,基于粒子群算法提出PSO—LVQ算法。PSO—LVQ算法利用PSO为LVQ神经网络寻找最适应的初始权值。算法的适应度函数定义为初始权值和输入样本集的平均聚集距离与最大聚集距离的变化率。该定义将输入样本集的数据分布特征作为PSO优化LVQ初始权值的依据。利用PSO-LVQ算法对乳腺癌进行诊断实验,并与其它相关算法进行比较。研究结果表明:PSO—LVQ神经网络算法在收敛性和分类准确率上都有改善和提升,乳腺癌诊断平均准确率可达95.94203%,最高可达100%,适用于乳腺癌的辅助诊断。  相似文献   

17.
王伟  龙文 《广西科学》2023,30(4):735-744
针对基本人工兔优化(Artificial Rabbits Optimization, ARO)算法在解决复杂优化问题时存在收敛慢、精度不高和容易陷入局部最优等缺陷,本文提出一种改进的ARO算法(记为IARO算法)。IARO算法中的基于正弦函数的非线性递减能量因子能够帮助算法实现从探索阶段到开发阶段的良好过渡,从而提高算法的收敛速度和解的质量。此外,为了提高算法跳出局部最优的概率,IARO算法引入了一种动态透镜成像学习策略。为了证明IARO算法的优越性,首先选取了6个基准测试函数进行数值实验,然后用其求解2个工程设计优化问题和1个包括15个数据集的特征选择问题,并与灰狼优化(GWO)算法、鲸鱼优化算法(WOA)、正弦余弦算法(SCA)和基本ARO算法进行对比。结果表明,IARO算法有着比其他对比算法更优越的性能。  相似文献   

18.
区间数据的并行模糊聚类算法   总被引:7,自引:0,他引:7  
研究了对区间数据进行聚类的模糊聚类算法;介绍和分析了模糊c-均值算法的基本思想及实现步骤;定义了区间数据的距离和四则运算,并推广模糊c-均值算法对区间数据进行聚类.在此基础上,讨论了对区间数据进行聚类的并行模糊c-均值算法.在分布式互连的PC/工作站环境下进行性能分析,结果表明并行的模糊c-均值算法具有好的可扩展性、规模增长性和加速比性能.  相似文献   

19.
【目的】在没有先验知识的前提下,采用基于粒子群优化算法(PSO)的加权模糊C-均值(WFCM)聚类算法,从30多万条记录的医疗保险数据中挖掘出疑似医疗保险欺诈的记录。【方法】首先,引用改进的欧式距离、相似性函数以及交叉熵函数并通过PSO算法极小化交叉熵函数,对属性权重进行分析;其次,选取Calinski-Harabasz(CH)有效性指标,展开聚类有效性的研究;然后,基于数据预处理的结果将数据运用于PSO算法,不断更新得到各属性的权重,并运用聚类有效性评价中的CH有效性指标来动态估计最佳聚类个数,提高FCM聚类的速度;最后,将属性权重和最佳聚类数应用于FCM聚类算法,根据隶属度矩阵聚类得到疑似医疗保险欺诈结果。【结果】基于上述研究方法,本研究根据最后的隶属度矩阵来进行聚类分析。【结论】将优化的权重应用于加权FCM聚类算法与聚类有效性评价,既提高了聚类算法的高效性,又避免了主观评价对分类的影响。  相似文献   

20.
现有的优秀的聚类算法大多是处理低维数据的,但是对于高维数据,由于其分布特性与低维情形有很大的差异,这些算法失效.为解决高维分类型数据聚类问题,提出了一种基于粗糙集的高维分类型数据子空间聚类算法,基于粗糙集的上、下近似集的类边界描述,确定了类边界范围,然后采用相容度来调整类边界,聚类的过程采用增长子空间的思想,从低维到高维迭代地搜子空间类簇.最后通过在soybean、zoo数据集上的对比实验,实验结果表明了算法不仅可行,而且精度高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号