首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
多维数据的聚类结果可视化技术综述   总被引:1,自引:0,他引:1  
在很多情况下,人们不仅需要聚类算法给出类标,还需要掌握聚类结构和数据分布情况.为满足后一项需求,出现了许多聚类结果的可视化(简称聚类可视化)技术,以图形的方式将多维数据和其聚类结果显示在二维或三维空间.从直接在二维或三维空间显示数据及其聚类结果、数据经降维(或映射)后显示以及其它显示方式3种角度综述了常用的30多种聚类可视化方法,并对各种方法的优缺点和适用性进行了分析和讨论.  相似文献   

2.
为了在不了解原始数据内部结构的情况下,确定合适的聚类数,本文提出了一种聚类结果稳定性的衡量方式,结合传统的手肘法来确定聚类数。实验采用了UCI上3个标准的机器学习聚类数据集,在wine数据集上,该方法和手肘法均能找到正确的分类数。在iris和digits数据集上,手肘法未能确定聚类数,本文方法给出了几个可能的聚类数(包含最优聚类数)。  相似文献   

3.
利用标签的层次化搜索结果聚类方法   总被引:2,自引:0,他引:2  
为了提高搜索引擎返回结果的可浏览性,满足用户对查询质量的要求,提出了一种层次化搜索结果聚类方法.首先,从搜索引擎的返回结果提取出文档集,并对每一个文档进行词干化、去除停用词等操作.然后,根据词共现信息来发现文档集中的频繁2元组,再将2元组扩展为n元组,对所有元组进行去冗余、重要性排序,从而获得候选聚类标签.最后,基于该标签对返回结果中的文档进行分配与聚集,形成层次化聚类结果.实验结果表明,所提方法可以通过获得的准确、可读性较好的聚类标签,帮助用户有效地浏览搜索引擎返回的结果.与Vivisimo、STC、Lingo算法比较,以及在多个评价指标上的综合实验结果也表明,该方法是有效的.  相似文献   

4.
针对短电话语音条件下文本无关说话人确认问题中语音数据不充分和电话信道失配问题,利用说话人特征参数之间的互补性,提出了一种对多子系统输出评分采用多个网络的融合策略,提高了话者确认系统的整体性能.实验结果表明:与传统的所有话者共享一个输出评分融合网络相比,应用多个融合网络,在采用KLD和GLR模型相似性测度时,系统等误识率分别下降了12.7%和10.8%.  相似文献   

5.
基于山峰聚类的聚类上限确定方法   总被引:1,自引:0,他引:1  
文章提出了一种基于山峰聚类的聚类上限检测方法,依靠山峰聚类确定聚类数目的上限,仿真试验表明,这种方法能将聚类上限确定在一个合理的范围之内,从而加快聚类的效率.  相似文献   

6.
在模糊C-均值聚类(FCM)目标函数的基础上按聚类中心分离原则增加一个聚类中心分离项来扩展FCM算法,提出基于聚类中心分离的模糊聚类模型(FCM_CCS)。该模型可使聚类过程中的聚类中心之间距离扩大,从而得到更好的聚类效果。由于该模型和FCM一样对噪声敏感我们提出它的可能性聚类模型(PCM_CCS),最后进一步扩展成它的可能性模糊聚类模型(PFCM_CCS)。基于聚类中心分离的可能性模糊聚类模型在处理噪声数据和克服一致性聚类问题方面表现出良好的性能。对数据集的测试实验结果表明了提出的PFCM_CCS能同时产生模糊隶属度和典型值,使聚类中心间距扩大,同时具有更好的聚类准确率。  相似文献   

7.
一种基于广义相似性的共调控基因聚类算法   总被引:1,自引:0,他引:1  
针对共调控基因的特殊性质和现有共调控基因聚类算法存在的不足,提出了基于广义相似性的聚类模型g-Cluster.正负共调控基因因具有相同的编码而被聚集到同一个共调控基因簇中.进一步提出了一种基于树结构的聚类算法FBTD,采用先宽度优先后深度优先的搜索策略,挖掘所有符合条件的最大g-Cluster,同时应用了高效的削减规则和优化策略.将该算法用于真实数据集.理论分析和实验结果都表明,该算法是实用和有效的.  相似文献   

8.
针对用户在搜索结果列表中寻找所需信息困难的问题,在分析了Web搜索结果的特点的基础上,提出了一种结合K-Means的层次化方法对搜索结果进行聚类,并通过向用户提供查询结果的类别标签分类显示结果,从而大大提高可浏览性.同时,在该方法的基础上设计并实现了一个搜索结果聚类原型系统,实验结果表明新方法是可行的.  相似文献   

9.
阐述了OODBs聚类技术中的聚类原则和聚类策略,分析了CK聚类算法和ORION聚类算法,并就影响算法性能的几个主要方面进行了说明。  相似文献   

10.
聚类算法是多元统计的一个重要分支,在理论和实际生活中都有重要的意义。本文对聚类算法的发展历程以及近年来发展的一些聚类算法进行研究。  相似文献   

11.
覆盖聚类算法   总被引:9,自引:0,他引:9  
首先比较几类主要的聚类算法,给出每类算法的基本概念、原理、每类的代表性算法,及这些算法的主要特征。在此分析基础上,提出一种新的聚类算法———覆盖聚类算法,该算法采用覆盖的概念将比较集中的样本聚合在一起,从而发现隐含在样本集中的类,对于周围稀疏的样本结合最短距离法,获得聚类效果,并用实验数据对分层聚类方法、LBG方法与覆盖聚类算法进行比较,证明了覆盖聚类算法的可行性和有效性。最后给出了算法的研究方向。  相似文献   

12.
定义了一种基于滑动匹配的相似度, 并在此基础上提出一种能够自适应确定聚类数目的全局K-均值算法, 解决了现有共调控基因聚类方法无法考虑到基因的正反、 延时、 部分时间和差异表达全部4种共调控关系的问题. 将提出的算法应用于微阵列数据中, 并将实验结果与CLUSTER 3.0算法进行了比较, 验证了算法的可行性和有效性.  相似文献   

13.
文中应用逐步聚类和模糊c-均值聚类于山西油松林分布区划分的比较研究,结果表明逐步聚类和模糊c-均值聚类具有很高的相似性。  相似文献   

14.
针对FCM算法的缺陷,文章提出了一种基于层次聚类的模糊聚类算法(HFCM)。该算法采用凝聚的层次聚类方法,可快速地发现高度聚集的数据区域,并对这些高密度区域进一步进行分析与合并,通过评估函数的评估,找到最优的聚类方案。试验结果表明,该算法具有较高的分类精确度和较高的排除噪声的能力。  相似文献   

15.
聚类分析是重要的数据挖掘方法,在商务智能、地理信息系统、医学等方面有广泛的应用.随着聚类分析的蓬勃发展,涌现出了许多聚类算法,其中最重要的算法之一是基于密度的空间聚类以及其多种变种——基于密度连通链、基于加权密度、基于引力连通集合的算法.这些算法在概念上相似但没有统一的描述.本文针对基于密度的空间聚类及其变种提出了拓扑的概念.给出了聚类拓扑结构的定义,把簇定义为拓扑连通集合.此外,本文运用全新的拓扑思想改进典型的算法,提出了一种拓扑聚类的新算法.实例证明此算法有效.  相似文献   

16.
硬聚类算法HCM的求解结果通常是局部最优解,本文将遗传算法应用于HCM聚类算法,同时考虑到该算法实现时的效率和开销,最终提出了一种新的算法MHCM聚类算法。测试数据实验表明采用MHCM聚类算法的结果90%以上能够取得全局最优解,远远超出了采用HCM算法所取得全局最优解的次数,证明了本算法的可推广性。  相似文献   

17.
一种基于名词短语的检索结果多层聚类方法   总被引:2,自引:0,他引:2  
为了对检索结果获取高质量的聚类效果,提取名词短语作为候选类别标签,根据候选类别标签分布情况生成基础类,再使用具有线性时间复杂度的一趟聚类算法对基础类进行多层聚类。与NEC,STC和Lingo算法的对比实验表明:该方法在类别标签的可读性、有效性以及聚类性能上都优于以上3种方法。  相似文献   

18.
聚类分析是一种基本的数据分析方法,它在数据挖掘,统计学,空间数据库技术,人工智能,生物学研究,机器学习,模式识别等领域都得到了广泛的应用.论文介绍了各类主要的聚类算法,并概述了其主要应用领域.  相似文献   

19.
提出一种简化的、带有确认程度的隶属度的二型模糊集,利用其设计二型FCM聚类算法,推导出其迭代求解公式。研究发现,二型FCM算法的目标函数和迭代求解公式是原有FCM算法的推广,数学表达简洁。在人工数据集和黄瓜数据集上的应用表明,该算法可以通过确认程度的影响,得到更加精确的FCM算法聚类中心的位置,可有效甄别出异常点,说明算法的有效性。  相似文献   

20.
原始的k-means算法是从样本点的集合中随机选取K个中心,这种选取具有盲目性和随意性,它在很大程度上决定了算法的有效性.为消除选取初始中心的盲目性,应充分利用已有数据样本点的信息.采取对数据进行预处理的方式来选取初始中心.实验证明新的初始点的选取不仅提高了算法的计算效率,也提高了算法最终确定的聚类的精度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号