首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
在对山峰聚类和减法聚类进行分析之后提出了一种通过划分网格、规约数据、减法聚类3步完成的聚类算法.仿真试验表明,此方法较之山峰聚类,减法聚类能明显减少计算量,提高聚类的速度.  相似文献   

2.
在聚类分析中,如何选择恰当的聚类个数是一个非常复杂而又必须面对的问题.尽管针对数值型数据聚类个数的选择算法已经进行了广泛地研究,但如何确定符号型数据的聚类个数仍然是一个富有挑战性的问题.结合划分和层次聚类的思想,提出一种符号数据聚类个数的确定算法.在UCI数据集上的实验结果表明该方法是有效的.  相似文献   

3.
基于模糊迭代聚类的水资源分区研究   总被引:3,自引:1,他引:3  
给出一种模糊聚类循环迭代模型以及确定最佳聚类数的方法,采用交叉循环迭代的方法确定聚类中心,通过判断聚类准则函数获得最佳聚类数。最后将模糊聚类循环迭代模型应用到对我国 29 个省、市、自治区的水资源分区的研究中,将水资源按照 4 个指标分为 5 个类别,结果表明,模糊循环迭代聚类模型得出的分区结果比较合理。  相似文献   

4.
模糊c-均值聚类算法(fuzzy C-means 简称FCM)和层次聚类算法是两种非常重要的聚类算法.由于FCM算法对初始聚类中心敏感,并且需要人为确定聚类类别数,这样收敛结果易陷入局部最优解.通过对这两种聚类算法的分析,首先对传统的凝聚层次聚类算法提出了改进,然后用改进的凝聚层次聚类算法得到最佳聚类数和初始聚类中心,最后用FCM算法进行再次聚类,以此得到更好的聚类结果并且减少了执行时间和迭代次数.  相似文献   

5.
覆盖聚类算法   总被引:9,自引:0,他引:9  
首先比较几类主要的聚类算法,给出每类算法的基本概念、原理、每类的代表性算法,及这些算法的主要特征。在此分析基础上,提出一种新的聚类算法———覆盖聚类算法,该算法采用覆盖的概念将比较集中的样本聚合在一起,从而发现隐含在样本集中的类,对于周围稀疏的样本结合最短距离法,获得聚类效果,并用实验数据对分层聚类方法、LBG方法与覆盖聚类算法进行比较,证明了覆盖聚类算法的可行性和有效性。最后给出了算法的研究方向。  相似文献   

6.
CABOSFV_C是一种针对分类属性高维数据的高效聚类算法,该算法采用集合稀疏差异度进行距离计算,并采用稀疏特征向量实现数据压缩。该算法的聚类效果受集合稀疏差异度上限参数的影响,而该参数的选取没有明确的指导。针对该问题提出基于集合稀疏差异度的启发式分类属性数据层次聚类算法( heuristic hierarchical clustering algorithm of categorical data based on sparse feature dissimilarity,HABOS),该方法从聚结型层次聚类思想的角度出发,在聚类数上限参数的约束下,应用新的内部聚类有效性评价指标( clustering validation index based on sparse feature dissimilarity, CVISFD)进行启发式度量,从而实现对聚类层次的自动选取。 UCI基准数据集的实验结果表明,HABOS有效地提高了聚类准确性和稳定性。  相似文献   

7.
将神经网络与数据集的密度指标结合起来提出一种山峰-减法聚类神经网络方法,利用数据集的密度指标对基类进行合并,并不断重复直至产生足够多的聚类中心,就可完成对聚类神经元的学习。给出该聚类的神经元模型和学习算法。该方法的主要优点是对于工程应用中的大样本集分类和重叠数据的模式分类问题,显得非常有效。  相似文献   

8.
程慈  柴瑞敏 《科技信息》2008,(14):143-143
对聚类分析中聚类数的确定问题进行了研究。在SOFM神经网络的基础上,从聚类准则出发,通过试验对聚类准则的曲线特征进行了详细的分析和论证,设计出一种结构自适应的聚类神经网络,该网络能自动确定最佳的聚类数,并提出了一种减少计算量的改进算法。  相似文献   

9.
在模糊C-均值聚类(FCM)目标函数的基础上按聚类中心分离原则增加一个聚类中心分离项来扩展FCM算法,提出基于聚类中心分离的模糊聚类模型(FCM_CCS)。该模型可使聚类过程中的聚类中心之间距离扩大,从而得到更好的聚类效果。由于该模型和FCM一样对噪声敏感我们提出它的可能性聚类模型(PCM_CCS),最后进一步扩展成它的可能性模糊聚类模型(PFCM_CCS)。基于聚类中心分离的可能性模糊聚类模型在处理噪声数据和克服一致性聚类问题方面表现出良好的性能。对数据集的测试实验结果表明了提出的PFCM_CCS能同时产生模糊隶属度和典型值,使聚类中心间距扩大,同时具有更好的聚类准确率。  相似文献   

10.
针对当前三支聚类方法不能有效处理数值型数据,且三支聚类结果受阈值影响问题,文章基于邻域关系提出了确定合适阈值的三支聚类方法。首先给出了确定最优K值的改进K-means聚类算法。进而基于邻域关系下的下、上近似引入精度,提出了权衡边界域和精度关系的有效性评价指标。应用该指标,给出了确定邻域下、上近似中最佳阈值的构建算法,进而得到三支聚类的核心域和边界域。最后,通过UCI数据集上的实验验证了该方法的可行性,且该方法有效提高了聚类精度。  相似文献   

11.
一种基于灰色聚类和模糊聚类的集成方法   总被引:2,自引:0,他引:2  
根据灰色聚类,模糊聚类,关联系数原理,提出一种新的综合集成方法,利用灰色关联系数将灰色聚类与模糊聚类集成,使聚类结果不仅反映了各聚类对象所属灰类的信息,还有效显化了各个对象间的相互关系的信息.  相似文献   

12.
To the problem that it is hard to determine the clustering number and the abnormal points by using the clustering validity function, an effective clustering partition model based on the genetic algorithm is built in this paper. The solution to the problem is formed by the combination of the clustering partition and the encoding samples, and the fitness function is defined by the distances among and within clusters. The clustering number and the samples in each cluster are determined and the abnormal points are distinguished by implementing the triple random crossover operator and the mutation. Based on the known sample data, the results of the novel method and the clustering validity function are compared. Numerical experiments are given and the results show that the novel method is more effective.  相似文献   

13.
聚类作为一种自动化程度较高的无监督机器学习方法,近年来在信息检索、多文档自动文摘、智能搜索引擎、短文本信息处理等领域获得了广泛的应用。本文首先讨论了文本聚类(Textclustering)的应用,然后对文本聚类算法、聚类关键技术进行了综述。  相似文献   

14.
通过对传统聚类法与现代聚类法各自包含的内容进行分析研究和比较,得出了两种聚类方法的异同点,为主题演化分析中聚类方法的深入研究和发展打下了坚实基础.  相似文献   

15.
聚类分析是一种寻求客观分类的方法,它是多元统计分析中三大实用方法之一。本文首先对聚类分析的各种算法进行分类与介绍;然后总结了聚类分析在经济、生物、电子商务、保险等方面的一些应用,并对两类应用较广泛的聚类算法进行对比分析;最后结合SPSS软件,分别运用系统聚类法和 K-均值聚类法对我国31个省区经济发展水平进行分类,发现二者分类结果相同,且与我国现阶段各省各地区经济发展现状吻合度较高。  相似文献   

16.
从样本点的核密度估计出发,对集聚型点模式的集聚中心的个数和位置的确定方法进行了探索,提出一种集聚中心的核估计算法.与原有的基于几何概率提取集聚中心的方法相比,该算法对只有一个集聚中心的情况以及任意维数的样本空间点具有更好的估计效果.  相似文献   

17.
针对利用k-均值聚类算法形成发电系统充裕度评估中的聚类负荷模型时存在的聚类中心初始值和聚类数难以确定的问题,提出根据负荷水平对充裕度指标的贡献度,将负荷曲线分成高贡献度、中等贡献度、低贡献度等分区,分别采用层次聚类、均值-标准差、随机法来选择各分区中聚类中心初始值;定义改进效率指标,将改进效率作为收敛条件确定聚类数.利用本文方法所得的聚类负荷模型,采用状态抽样法计算IEEE RTS79电力系统可靠性测试系统的发电系统充裕度指标.算例结果表明,同采用基于传统k-均值聚类方法的负荷模型结果相比,基于混合聚类方法得出的负荷模型的计算结果更精确,收敛速度更快.  相似文献   

18.
给出了一种新的处理海量数据的聚类算法WIDE(window-density clustering algorithm).它通过网格方法将数据之间的相互关联局部化,通过窗口技术来提高算法的效率,通过密度方法提高聚类的精度.以窗口为中介将网格方法和密度方法融合在一起是算法的主要思想.在此基础上对算法进行了扩展,在功能方面实现了混合型数据聚类、含障碍物数据聚类和增量数据聚类;在速度方面实现了分布式并行聚类.WIDE算法能够在局域网中的多台计算机上并行工作,效率高,计算复杂度为O(N),且能够发现任意形状的聚类,对噪声不敏感.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号