首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
基于遗传优化的采样模糊C均值聚类算法   总被引:14,自引:0,他引:14  
在数据挖掘领域,模糊C均值聚类法(FCM)在处理小量低维的数据挖掘时是有效的,但是面向数据库的数据挖掘经常要处理大量、高维的数据.在这种情况下,FCM算法在时间性能上难以令人满意.本文基于采样技术对FCM算法进行改进,以提高算法的时间性能,并利用遗传算法对聚类结果进行优化以保证聚类的质量,给出了一种新的基于遗传优化的采样模糊C均值聚类算法SFGO(SamplingFCMwithGeneticOptimization).仿真实验证明SFGO算法在大规模数据库的聚类挖掘中,在时间性能和聚类质量上都能获得较满意的结果.  相似文献   

2.
基于约束聚类的一种概念学习方法   总被引:2,自引:0,他引:2  
首先定义了字符属性例子空间中合取规则的可学习性,通过将正例集合划分为多个子集,其中每个子集在全体反例集合上均是合取规则可学习的,并建立了命题规则的一般学习模型.然后,提出了三种正例集合的自动聚类和划分方法:相似性度量、差异度量和规则长度等,并设计了一种快速的合取规则学习方法.同时,基于最小覆盖率和最小错误率给出了一种克服过学习问题的后处理方法.最后,针对一组典型的学习问题进行了实验计算,并与已有算法进行了对比分析。  相似文献   

3.
一种聚类神经网络初始聚类中心的确定方法   总被引:6,自引:0,他引:6  
孙辉  李文  聂冰 《系统仿真学报》2004,16(4):775-777
在基于聚类神经网络提取模糊规则方法中,其初始聚类数及聚类中心往往是事先给定的,这样会给规则提取带来一定的盲目性,并影响神经网络的学习时间和聚类效果。本文提出了一种根据测量数据集自动确定聚类神经网络初始聚类中心的方法,该方法可客观地确定聚类数和初始聚类中心,能够有效地缩短神经网络的学习时间。  相似文献   

4.
基于K-means算法的改进蚁群聚类算法及其应用   总被引:2,自引:0,他引:2  
基于化学识别的蚁群聚类算法无需给定聚类数目就能自动实现数据集的聚集,但大量采用随机策略使得蚂蚁达到平衡的运行时间长,效率不高。为此提出了一种用K-means算法做初次聚类、蚁群聚类算法再次聚类的新算法,结果表明该算法具有较高的正确率。最后将该算法应用于系统应用协同中,得到了较好的分析结果。  相似文献   

5.
一种新的混合聚类算法   总被引:3,自引:2,他引:3  
聚类是数据挖掘的主要技术之一,是一种无导师监督的模式识别方式。聚类分析就是按照数据间的相似程度,依据特定的准则将数据划分成不同子类。K-平均算法是经典的聚类算法。蚂蚁聚类算法是近来涌现的新的聚类算法,它通过模拟蚁群的智能行为进行聚类分析,已经在数据挖掘中得到应用。通过分析蚂蚁聚类算法和K-平均算法两种不同聚类算法的基本思想,将两种算法结合得到混合聚类算法,仿真实验证明混合聚类算法的算法性能优于蚂蚁算法和K-平均算法。  相似文献   

6.
基于牛顿-遗传混合算法的几何约束问题的求解   总被引:1,自引:0,他引:1  
曹春红  张斌  李文辉 《系统仿真学报》2007,19(16):3650-3652
将几何约束问题转化为非线性方程组的形式。传统的求解几何约束问题的牛顿法具有较好的局部收敛性,但是对于一些强非线性方程,传统数值法容易导致求解失败,有效性较低。而遗传算法具有较好的全局收敛性。将遗传算法和牛顿法结合起来,引入牛顿-遗传混合算法来求解几何约束问题。在遗传算法中嵌入一个牛顿算子,以发挥传统数值算法在计算速度与计算精度上的优势。将该混合算法应用于几何约束求解,实验表明该算法在解决完备约束和欠约束问题上都获得令人较满意的结果。  相似文献   

7.
基于最优划分的K-Means初如聚类中心选取算法   总被引:1,自引:0,他引:1  
针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自身分布特点确定K-Means算法的初始聚类中心,无需预设k值,减少了算法结果对参数的依赖,提高算法运算效率及准确率.实验结果表明,利用该算法改进的K-Means算法,运算时间明显减少,其聚类结果准确率以及算法效率均得到显著提高.  相似文献   

8.
粗糙核k-means聚类算法   总被引:1,自引:0,他引:1  
通过研究核聚类算法,以及粗糙集,提出了一个新的用于聚类分析的粗糙核聚类方法。通过mercer核映射把输入空间中的样本映射到Hilbert空间,使样本空间中没有显现的特征在特征空间中突现出来,在这种样本差异加大的基础上,结合粗糙集的思想,把样本分别划到相应聚类中心的上、下近似中,上、下近似中的样本按照一定的比例来共同决定新的聚类中心。这样不但聚类精度大大提高,而且算法收敛速度也较快。仿真实验的结果表明该算法的可行性和有效性。  相似文献   

9.
离群数据挖掘是数据挖掘研究的重要内容,在实际生活中获得广泛应用.论文结合了免疫算法全局搜索的优点和K-均值方法局部收敛速度快的特点,提出了一种基于免疫聚类算法的离群数据挖掘方法,有效地克服了传统聚类方法对初始化敏感、容易陷入局部最优等缺点,使聚类结果能够快速收敛到全局最优,有效地检测离群数据.实验结果表明,该方法实用有效的.  相似文献   

10.
对并行图聚类算法进行了研究。基于Spark 提出了一个新的并行图聚类算法;由于Spark 中的top 操作需要耗费大量的内存,提出了一个新算法来替代top 操作,有效减少了所消耗的内存;通过对自底向上的层次聚类算法进行改进提高了聚类的速度;基于图数据的特征提出了一种图数据过滤的方法来减少算法运行的时间以及所占用的空间并对其有效性进行了说明。仿真结果表明,运行效果优于进行比较的其他并行化图聚类算法。  相似文献   

11.
一种基于区间数多指标信息的FCM聚类算法   总被引:8,自引:0,他引:8  
针对一类具有不确定性区间数多指标信息的聚类分析问题,基于传统的数值信息FCM(fuzzy c-means)聚类算法,提出了一种新的聚类分析算法.首先描述了具有区间数多指标信息的聚类分析问题,其次提出并证明了基于区间数多指标信息的关于最优划分和最优聚类中心确定的两个定理.然后根据提出的两个定理,进一步给出了基于区间数信息的FCM聚类算法的迭代步骤.最后,通过一个算例说明了给出的聚类算法.  相似文献   

12.
针对非均匀类簇密度聚类问题,从商空间粒度理论出发,提出一种多粒度自学习聚类算法 (multi-granularity self learning clustering algorithm, MSCA)。算法通过构造聚合树结构和定义粒度函数对问题逐层求解,并在每层聚合过程中根据聚合区间以自学习的方式动态确定聚合粒度,解决了传统聚类算法从非均匀类簇密度数据中无法得到不同层次的聚合特征且参数对经验依赖性过高的问题。理论和实验表明,MSCA算法可以发现任意形状类簇,有效处理噪声,并能发现关键聚合层,具有较好的计算复杂性。  相似文献   

13.
基于AIC准则的最近邻聚类模型的优化算法   总被引:2,自引:0,他引:2  
聚类分析方法的困难在于聚类模型的类中心和类别数的确定。首先给出了最近邻聚类规则,并根据该规则建立了确定聚类模型的分类方法;其次针对不同的聚类模型提出了优化判别准则———AIC准则,为解决所聚类的紧凑性与类别数增加的矛盾给出了理论分析。通过实例仿真,验证了本方法的实用性和正确性。  相似文献   

14.
针对模糊C均值(fuzzy C means, FCM)聚类算法没有考虑噪声样本点和样本数据的分布特征对聚类结果影响的不足,利用数据加权策略对FCM聚类算法进行改进。改进后的算法通过计算各样本点的密度值,将初始聚类中心限制在高密度样本点区域,并把样本点的密度值作为该点的权值,对聚类中心进行调整,突出高密度样本点在聚类中心调整中的影响力,从而达到提高聚类效果的目的。人造数据集和加州大学欧文分校(University of California Irvine, UCI)真实数据集的实验结果表明,在不提高时间复杂度的同时,与FCM算法相比,基于数据加权策略的FCM算法聚类的准确率更高。  相似文献   

15.
改进的基于矢量空间的群体聚类算法   总被引:1,自引:0,他引:1  
针对群体聚类算法中,一般以群体成员偏好矢量的相似度作为相聚依据,但这类方法通常不能保证群体聚类后聚集的一致性的问题。提出了成员与成员集的相似度概念,给出了基于聚集一致性的成员与聚集相聚的条件,描述了一个改进的群体聚类启发式算法。同时,还定义了群体及聚集一致性的偏差指标和相对偏差指标,用以评估聚类结果。实例测试表明,该算法有较好的聚类性能和较低的一致性偏差指标。  相似文献   

16.
锅炉燃烧系统的聚类自适应模糊控制器的设计   总被引:2,自引:0,他引:2  
将聚类算法和模糊控制相结合,提出一种新型的聚类自适应模糊控制方案,应用于非线性、大延迟、强耦合的锅炉燃烧系统中,并用遗传算法将模糊控制器的隶属参数进行了优化,仿真表明该方案的适应性和鲁棒性都很强,具有很大的工程实用价值。  相似文献   

17.
基于流量间隔限制策略和航路排序策略之间的关联性建立了两种策略一体化决策的二层双目标规划模型.模型将间隔限制值作为上 层规划的决策变量,将排序相关变量作为下层规划的决策变量,在上层规划中同时考虑下级的目标函数.对模型设计了基于NSGA-II的多 目标遗传算法求解,采用了一个快速启发式算法求解下层规划的单目标问题.结合中南区域实际空域及流量数据对模型进行了验证, 并与当前实际运行中的按交通需求比率分配方法进行了比较.结果表明所建立的二层双目标规划模型能满足一体化决策的需求, 所采用的算法能求得多个Pareto近似最优前沿解以供决策选择.  相似文献   

18.
自适应特征熵权模糊C均值聚类算法的研究   总被引:1,自引:0,他引:1  
特征权重算法对聚类效果有很大的影响,而传统的特征权重算法忽略了特征项在类间和类内的分布情况.因此,研究聚类后样本特征属性表现的有序性程度对聚类结果的影响,分析聚类后样本特征属性的分布情况,提出了一种自适应特征熵权模糊C均值聚类算法.该算法以聚类后的特征熵和信息增益作为准则调整特征权值,通过聚类与权重更新逐步迭代优化,直至获得最优的特征权值.实验表明,自适应特征熵权模糊C均值聚类算法能够有效地区分各个特征属性对聚类效果的重要程度;较于其它加权模糊C均值聚类算法,该算法能够得到更高的聚类准确率.  相似文献   

19.
用K均值算法进行文本聚类通常只能以局部最优结束,很难找到全局最优.文章提出了一种基于混沌社会演化算法的文本聚类新方法.在该方法中提出了认知主体在聚类中对范式继承的方式,在认知主体对范式的背叛中提出一种混沌变异算子.实验证明该方法不但能有效地提高文本聚类的效率而且能有效地提高文本聚类的精度.  相似文献   

20.
针对计算机兵棋推演数据的特点,提出了一种基于密度的快速聚类算法-基于密度的快速空间聚类算法(quick density based spatial clustering of applications with noise, QDBSCAN),目的是通过聚类检测孤立点,快速定位地面部队兵力部署上的缺陷。QDBSCAN算法在基于密度的空间聚类算法(density based spatial clustering of applications with noise, DBSCAN)算法的基础上做了相关改进:在邻近度度量上提出了最短可行路径的概念,使聚类更符合计算机兵棋的规则;动态设置密度参数;采用提出的代表对象选择方法来减少对对象邻域的判断次数;按区域对数据进行分组以缩小聚类规模。实验表明,QDBSCAN算法的性能在数据规模较大的情况下,明显优于DBSCAN算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号