首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
【目的】针对k-Means聚类算法及MinMax k-Means聚类算法需要人为提前给定聚类数量而导致数据划分准确率偏低以及MinMax k-Means算法聚类效果受类簇边缘点影响较大等不足提出解决方案。【方法】将k-Means和MinMax k-Means算法的目标函数相结合,建立多目标优化模型,提出基于多目标优化方法的k-Means算法。分析簇数异常情况下最小中心方差与最大簇内方差之间的关系。【结果】发现当分类簇数大于最优簇数时,最小中心方差小于最大簇内方差,据此提出了基于多目标优化方法的k-Means自适应算法。【结论】数值实验表明:提出的自适应算法在人工数据集和UCI标准数据集均具有较好的自适应性且聚类效果较优。  相似文献   

2.
基于入侵性杂草克隆的图像聚类方法   总被引:2,自引:0,他引:2  
针对原始谱聚类初始敏感的缺点,提出了一种新的基于入侵性杂草优化(IWO)的图像聚类方法(CIWO).该算法通过计算峰值信噪比(PSNR),动态确定图像聚类簇数的最优选择范围,采用最小量差、最小簇内距离、最大簇间距离重新构造了图像聚类质量的评价函数,通过模拟杂草克隆的自然行为对图像数据集的簇中心进行快速准确定位.将算法应用于几个基准测试图像,并通过聚类有效性准则与k-Means、FCM、PSO等方法进行比较,发现CIWO具有更稳定的图像聚类性能.实验结果也表明,所提出的算法可获得更优的图像聚类质量.  相似文献   

3.
平衡迭代规约层次聚类(balanced iterative reducing and clustering using hierarchies, BIRCH)算法是一个综合的层次聚类算法。但BIRCH算法为叶子节点中的簇设置统一的空间阈值,根据数据对象与簇之间的距离来决定数据对象的插入位置,从而忽略了簇与簇之间的关系;此外,算法在分裂节点时,选取距离最远的2个聚类特征作为子簇,其他聚类特征会根据与这2个聚类特征之间的距离关系分裂为另外的子簇,造成处于簇与簇之间的样本数据错误分类,这样会忽略聚类特征之间的关系。针对BIRCH算法的这2个问题,提出了基于阈值的自适应算法,用于解决原算法统一空间阈值的问题;并在针对聚类特征关系的问题上,结合朴素贝叶斯算法对原算法进行改进。对改进后BIRCH算法与传统的算法进行仿真实验。结果表明,改进算法在损失效率的情况下,聚类效果得到了明显的改善,并且与其他算法相比,所提算法具有不错的表现性,而且具有跨数据集的鲁棒性。  相似文献   

4.
针对大学生就业问题,以层次聚类策略为技术支撑,架构出一种就业去向短期预测系统.根据待挖掘数据量,选取簇间距离度量标准,架构簇与子簇构成的层次聚类树,完成目标数据的聚类或分类处理.构建层次聚类算法模块中相关算法运行流程,结合预测系统用户与管理员的角色职责,设计多个系统数据库实体.建立各实体间关系的映射模型,基于此完成数据...  相似文献   

5.
聚类是对数据对象的集合无指导地进行分组,聚类算法的好坏直接影响聚类的效果。聚类分析应用广泛,既能作为一个独立的工具来进行数据分析,也可以作为其它算法的预处理步骤。本文从经典的k-Means聚类算法出发,分析了它存在的不足,提出了两种改进的k-Means聚类算法,并从理论上分析了这两种算法可以很好的提高聚类的效果。  相似文献   

6.
密度峰值聚类(clustering by fast search and find of density peaks, DPC)算法是一种基于密度的聚类算法,它可以发现任意形状和维度的类簇,是具有里程碑意义的聚类算法。然而,DPC算法的样本局部密度定义不适用于同时发现数据集的稠密簇和稀疏簇;此外,DPC算法的一步分配策略使得一旦有一个样本分配错误,将导致更多样本的错误分配,产生“多米诺骨牌效应”。针对这些问题,提出一种新的样本局部密度定义,采用局部标准差指数定义样本局部密度,克服DPC的密度定义缺陷;采用两步分配策略代替DPC的一步分配策略,克服DPC的“多米诺骨牌效应”,得到ESDTS-DPC算法。与DPC及其改进算法KNN-DPC、FKNN-DPC、DPC-CE和经典密度聚类算法DBSCAN的实验比较显示,提出的ESDTS-DPC算法具有更好的聚类准确性。  相似文献   

7.
本文针对传统FCM(模糊C均值)聚类算法对初始中心值非常敏感,并且对数据集属性要求过高的缺陷,提出了采用信息熵的方法对聚类中心进行初始化,以此来降低算法对初始聚类中心的依赖.同时为了使算法能够对任意形状的簇进行聚类,本文引用了类合并的思想,将任意形状的簇分割成小类,再通过一定的规则将小类对进行合并.实验结果证实了在FCM基础上改进的模糊聚类新算法能够识别任意形状的簇,并大大降低了FCM算法对初始聚类中心的依赖.  相似文献   

8.
针对原始谱聚类初始敏感的缺点,构造了图像聚类质量的评价函数,提出了一种新颖的基于入侵性杂草优化的图像聚类算法(CIWO)。算法模拟杂草克隆的鲁棒性、适应性和随机性等特点,简单易于实现,具有快速精确地对图像灰度数据集的簇中心进行全局定位能力。将算法应用于几个测试图像,并通过聚类有效性准则与k-Means、FCM、PSO等方法比较分析CIWO具有更稳定的图像聚类性能,实验结果表明提出的算法得到了更优的图像聚类质量。  相似文献   

9.
随机选择初始聚类中心的k-means算法易使聚类陷入局部最优解、聚类结果不稳定且受孤立点影响大等问题.针对这些问题,提出了一种优化初始聚类中心的方法及孤立点排除法.该算法首先选择距离最远的两点加入初始化中心,再根据这两点将原始簇分成两个聚簇,在这两个簇中挑选方差较大的簇按照一定的规则进行分裂直至找到k个中心,初始中心的选择过程中用到孤立点排除法.在UCI数据集及人造含一定比例的噪音数据集下,通过实验比较了改进算法与其他算法的优劣.实验表明,改进后的算法不仅受孤立点的影响小、稳定性好而且准确度也高.  相似文献   

10.
针对无线传感器网络中基于低能量自适应聚类层次(LEACH)算法进行分簇时出现的簇分布不均匀及路由能量消耗过快问题,提出一种基于双簇头聚类和数据融合的分簇算法.该算法在分好的簇中选择两个级别的簇头,两个簇头履行不同职责,能更好地均摊能量消耗,提高了分簇均匀性.仿真实验结果表明,该算法降低了网络能耗,提升了网络生命周期.  相似文献   

11.
针对近邻传播(Affinity Propagation,简称AP)算法在对非团状数据集聚类过程中出现的局部聚类较多、精准度不高等问题,提出了一种基于改进AP算法的聚类质量评价模型.首先,在AP算法初步聚类的基础上,通过合并相似度较大的簇,减小聚类上限值k_(max),进一步压缩聚类区间范围;其次,给出一个新的内部评价指标,用分属不同簇的样本对的平均距离代表簇间距离,削弱噪声数据的影响,平衡簇间分离度与簇内紧致度的关系.在UCI和KDD CUP99数据集上的实验结果表明,新模型可以给出精准的最优聚类数(范围),能够在保持较低漏报率的同时,有效提高样本的检测率和分类正确率.  相似文献   

12.
一种基于最大最小距离和SSE的自适应聚类算法   总被引:1,自引:0,他引:1  
K均值聚类是一种常用的聚类算法,需要指定初始中心和簇数,但随意指定初始中心可能导致聚类陷入局部最优解,且实际应用中簇数未必是已知的。针对K均值聚类的不足,文中提出了一个自适应聚类算法,该算法基于数据实例之间的最大最小距离选取初始聚类中心,基于误差平方和(SSE)选择相对最稀疏的簇分裂,并根据SSE变化趋势停止簇分裂从而自动确定簇数。实验结果表明,该算法可以在不增加迭代次数的情况下得到更准确的聚类结果,验证了所提聚类算法是有效的。  相似文献   

13.
针对不平衡数据集的低分类准确性,提出基于蚁群聚类改进的SMOTE不平衡数据过采样算法ACC-SMOTE.一方面利用改进的蚁群聚类算法将少数类样本划分为不同的子簇,充分考虑类间与类内数据的不平衡,根据子簇所占样本的比例运用SMOTE算法进行过采样,从而降低类内数据的不平衡度;另一方面对过采样后的少数类样本采用Tomek ...  相似文献   

14.
现有的绝大多数过采样方法着重于寻找少数类样本的边界从而增强样本的可分性,忽略了样本的重叠分布与小析取问题,这导致在过采样阶段产生过多的噪声,最终无法实现对少数类样本的正确分类.针对这些问题,提出一种基于密度峰值聚类和局部稀疏度的过采样算法.首先利用改进的密度峰值聚类算法对全部样本自适应地划分出多个簇,根据簇内样本的不平衡比过滤掉不平衡比过高的簇,然后在筛选出的簇中根据少数类样本的分布情况对各簇的过采样个数进行分配,最后通过样本密度计算出各簇少数类样本的局部稀疏度,从中选择出稀疏度较高的少数类样本参与到最终的合成少数过采样.将提出的过采样算法与八种常用的过采样算法分别与三种基分类器相结合,在18个不平衡数据集上进行对比实验.实验结果表明,提出的算法总体上表现更优,能得到更好的分类性能.  相似文献   

15.
作为大数据的重要组成,产生于传感器、移动电话设备、社交网络等的不确定流数据因其具有流速可变、规模宏大、单遍扫描及不确定性等特点,传统聚类算法不能满足用户高效实时的查询要求.首先利用MBR(minimum bounding rectangle)描述不确定元组的分布特性,并提出一种基于期望距离的不确定数据流聚类算法,计算期望距离范围的上下界剪枝距离较远的簇以减少计算量;其次针对簇内元组的分布特征提出了簇MBR的概念,提出一种基于空间位置关系的聚类算法,根据不确定元组MBR和簇MBR的空间位置关系排除距离不确定元组较远的簇,从而提高聚类算法效率;最后在合成数据集和真实数据集进行实验,结果验证了所提出算法的有效性和高效性.  相似文献   

16.
提出了一种基于ai Net免疫网络模型的K-means聚类算法。该算法利用ai Net免疫网络模型中抗体-抗原之间的亲和力来计算聚类中心点,将数据分为若干子簇,之后再通过K-means聚类算法将这些子簇合并,得到最终的结果。该算法继承了免疫算法速度快,效率高的优点,同时也避免了K-means聚类算法容易陷入局部极小值的缺点,是一种高效的并行搜索算法。  相似文献   

17.
为了解决集中式聚类算法不能处理海量大数据的问题,提出基于Fisher判别确定置信半径的分布式聚类算法.应用网络上各个节点的计算、存储能力,以及网络的带宽,将聚类所需的时间复杂度和空间复杂度平摊到各个节点.通过应用Fisher线性判别找到节点在同一子类数据上的稠密和稀疏分布,从而快速确定聚类的置信半径并指导下一步的聚类过程,使得保持聚类精度的同时能提高分布式聚类的速度.对算法进行了数值模拟,并使用真实数据完成了试验.结果表明,所提出算法相比DFEKM聚类算法,能根据数据分布的不同在聚类结果和聚类速度上达到很好的平衡,这表明该算法具有更好的健壮性.  相似文献   

18.
给出了由半环的格林关系所确定的开同余的刻画与性质。通过这些开同余,得到了系列半环类,证明了这些半环类均是半环簇,并揭示了这些半环簇之间的关系。通过对半环簇的子簇格上的开算子的探究,得到了乘法幂等半环簇的子簇格到开簇格的直积上的序嵌入定理。  相似文献   

19.
目前多数多视角聚类算法属于"刚性"划分算法,不适用于处理具有聚簇重叠结构的数据集,为此,提出一种基于模糊C-means的多视角聚类算法(简称FCM-MVC),该算法利用隶属度描述对象与类别的关系,能够更真实地描述具有聚簇重叠结构数据集的聚类结果。FCM-MVC算法同时利用多个视角信息,自动计算每个视角的权重。研究结果表明:FCM-MVC算法能够有效处理具有聚簇重叠结构的数据集;与已有的3种经典的多视角聚类算法相比,该算法获得的聚类精度更高。  相似文献   

20.
针对传统生物地理优化算法(bio-geographic optimization algorithm,BBO)的种群随机初始策略会降低聚类算法性能的问题,提出了一种基于自组织映射算法(self-organization feature map,SOM)和BBO的混合聚类算法(improved SOM and bio-geography optimization,ISOMBBO),通过优化初始化神经元权值的方法改进SOM算法,然后以改进的SOM来计算数据聚类的初始簇中心,最后在BBO优化框架下进行数据簇结构的寻优.在4个标准数据集(Iris、Wine、Glass与Diabetes)的实验中,实验结果表明该算法不仅提高聚类的有效性,而且相对于传统的优化算法具有更好的优化能力和收敛度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号