首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
数据挖掘是近年来非常热门的研究方向。聚类分析是数据挖掘的一个重要研究领域。本文归纳总结了数据挖掘中传统聚类算法,并对现今新发展的,比较热门的聚类算法进行了介绍。  相似文献   

2.
K-means聚类算法是近年来数据挖掘学科的一个研究热点和重点,该算法是基于划分的聚类分析算法.目前这种算法在聚类分析中得到了广泛应用。本文将介绍K-means聚类算法的主要思想,及其优缺点。针对该算法经常陷入局部最优,以及对孤立点敏感等缺点,提出了一种基于模拟退火算法的方法对其进行优化,可以有效地防止该算法陷入局部最优的情况。  相似文献   

3.
基因聚类结果的内部确认技术研究   总被引:3,自引:0,他引:3  
聚类分析是后基因组时代基因表达数据处理的主要技术之一.聚类确认是聚类分析过程中的必要环节,其目的是对聚类结果的质量和聚类算法的性能进行评估,有助于聚类结果的注释.选择有效的确认函数是正确评价聚类结果的前提.文中采用分层聚类、K-均值聚类和SOMs算法对标准基因表达数据集进行聚类分析,研究了Silhouette指数、Dunn's指数、Davies-Bouldin指数及FOM(Figure of merit)测量等内部确认函数在基因聚类分析中评价聚类结果质量的有效性.结果表明:Silhouette指数和FOM测量能较好地反映聚类算法的性能和聚类结果的质量,Dunn's指数因其对噪声的高度敏感性不能直接用于基因聚类结果的确认,Davies-Bouldin指数确认算法的能力好于Dunn's指数,但偏爱单连接聚类.上述研究结论将为基因聚类分析中聚类算法的评估与聚类结果的确认提供有价值的参考依据.  相似文献   

4.
数据挖掘是用来发现数据库中隐含的各个数据之间的关系和特性,聚类分析是数据挖掘所要完成的工作之一.选取了三个并行聚类分析算法并研究了与之对应的并行算法,然后讨论了并行算法的性能,并得到了一些实验结果.最后提出了一个新的并行算法,相比较其它并行聚类算法,本文所提出的算法是最有效的.  相似文献   

5.
数据挖掘是一种新兴的信息处理技术,模糊聚类是数据挖掘领域中的一个重要研究课题。论文从数据挖掘的概念出发,研究分析了模糊聚类的主要算法,并从多个方面对这些算法性能进行比较,同时还对模糊聚类分析在数据挖掘中的应用进行了阐述,最后对模糊聚类的研究领域进行了总结和展望。  相似文献   

6.
通过将粗糙集和模糊聚类算法相结合, 利用粗糙集中上近似集和下近似集的概念改进模糊聚类算法, 解决了模糊聚类边界不确定的问题, 得到了上近似集和下近似集的聚类结果, 从而实现更好的聚类, 改进算法可以处理边界问题和复杂数据问题. 将改进的粗糙集模糊聚类算法用于研究环糊精聚类, 并将聚类结果与K均值聚类分析算法、 模糊C均值聚类算法相比, 实验结果表明, 改进算法有较好的聚类效果.  相似文献   

7.
聚类分析是一种基本的数据分析方法,它在数据挖掘,统计学,空间数据库技术,人工智能,生物学研究,机器学习,模式识别等领域都得到了广泛的应用.论文介绍了各类主要的聚类算法,并概述了其主要应用领域.  相似文献   

8.
聚类分析是一种寻求客观分类的方法,它是多元统计分析中三大实用方法之一。本文首先对聚类分析的各种算法进行分类与介绍;然后总结了聚类分析在经济、生物、电子商务、保险等方面的一些应用,并对两类应用较广泛的聚类算法进行对比分析;最后结合SPSS软件,分别运用系统聚类法和 K-均值聚类法对我国31个省区经济发展水平进行分类,发现二者分类结果相同,且与我国现阶段各省各地区经济发展现状吻合度较高。  相似文献   

9.
在聚类分析中,如何选择恰当的聚类个数是一个非常复杂而又必须面对的问题.尽管针对数值型数据聚类个数的选择算法已经进行了广泛地研究,但如何确定符号型数据的聚类个数仍然是一个富有挑战性的问题.结合划分和层次聚类的思想,提出一种符号数据聚类个数的确定算法.在UCI数据集上的实验结果表明该方法是有效的.  相似文献   

10.
聚类分析要求较高聚类质量和快速响应能力,各行业数据仓库中的大量、高维数据对算法的效率提出了更大的挑战.CURE算法能够提供高质量聚类结果但不满足联机聚类要求.结合数据仓库数据不定期批量、增量更新的特点,提出了一种新的增量式CURE聚类算法——InCURE,利用对象的互连性和近似度,保持原算法的动态聚类特性的同时大大缩短聚类时间.5维、20维、50维的大量数据实际测试表明无论低维还是高维数据,InCURE都比CURE具有更高的效率,适合数据仓库环境下的增量式聚类分析.  相似文献   

11.
将万有引力和牛顿第二运动定律的思想引入到聚类分析中,提出了一种基于引力的聚类算法CABG.该算法可以自动决定目标数据集中的簇的个数,并且能发现任意形状的簇且可以过滤“噪声”数据.实验结果表明CABG可以产生高质量的聚类结果.  相似文献   

12.
分析数据挖掘领域的聚类分析方法及代表算法,比较这些算法的性能,对数据挖掘中的谱系聚类进行举例说明.实践证明谱系聚类是一种有效的可用于数据预处理的离散化方法,可以快速和合理的解决粗糙集数据挖掘中数据预处理的问题.  相似文献   

13.
空间聚类分析是空间数据挖掘的一种方法,空间聚类分析能从空间数据库中直接发现一些有用的聚类结构。在此引入了一种基于邻接关系的空间聚类算法,该算法可以实现对空间复杂地理对象的聚类分析。在具体的模拟试验中,利用该算法可以将相邻的并且符合选取条件的空间目标聚类成一类。  相似文献   

14.
基于差异度聚类分析,提出了一种新的异常入侵检测算法DCAIDA,详细介绍了基于差异度聚类分析的用户行为模型建立算法和异常入侵检测算法.通过对原始用户行为数据进行差异度聚类分析,建立用户行为模型,并依据聚类模型对实时的用户行为进行分类,以此判断是否发生入侵.在KDD CUP 1999上的仿真实验结果表明:该算法检测率高、误报率低,且对新攻击类型有一定的检测能力,可实现预期效果.  相似文献   

15.
程慈  柴瑞敏 《科技信息》2008,(14):143-143
对聚类分析中聚类数的确定问题进行了研究。在SOFM神经网络的基础上,从聚类准则出发,通过试验对聚类准则的曲线特征进行了详细的分析和论证,设计出一种结构自适应的聚类神经网络,该网络能自动确定最佳的聚类数,并提出了一种减少计算量的改进算法。  相似文献   

16.
期货公司客户信用风险的控制和管理对期货公司发展与进步有着举足轻重的作用,聚类分析可以作为客户分类方法之一为期货公司所用,而模糊聚类是聚类分析的新方法之一.本文基于期货公司客户的实际交易数据,首先提取若干特征指标作为聚类分析的基本变量,然后分别运用K-均值聚类算法和改进的模糊聚类分析方法对期货公司的客户进行分类,最后将两...  相似文献   

17.
在传统层次聚类基础上,提出并实现了一种基于距离的增量式聚类算法,并应用于粮食智能决策支持系统中,算法在保持层次聚类优点的基础上,利用原有的聚类结果提高聚类速度,并可以根据用户需要在聚类精度和聚类速度两方面选取一个适当的平衡点,有效地提高聚类分析的效率。  相似文献   

18.
K-means聚类算法研究   总被引:1,自引:0,他引:1  
K-means算法作为聚类分析算法,已被广泛地应用到诸多领域.本文研究了K-means算法的基本原理,并将其应用到高校学生入学信息分析中.高考学生入学的相关信息包含了大量重要的学习及其他方面的信息,对这些数据信息进行分析和研究,有助于教师对不同类别的学生进行不同方式的教学,做到因材施教.首先对学生的入学信息数据进行预处理,然后使用K-means算法,对学生信息进行分类评价;最后利用所获得的分类结果指导学生在大学期间的学习方向以及教师对学生的培养工作.  相似文献   

19.
数据挖掘领域中的聚类方法   总被引:4,自引:0,他引:4  
聚类算法是数据挖掘中的核心技术,随着对聚类算法广泛深入的研究,产生了许多不同的适用于数据挖掘的聚类算法;文章从算法的角度论述了如何在数据挖掘中进行聚类分析,并通过基于评价聚类算法好坏的8个标准,对数据挖掘中近几年提出的常用聚类方法作了比较分析,以利于人们更容易、更快速的找到一种适用于特定问题的聚类算法.  相似文献   

20.
基于密度的聚类算法因其抗噪声能力强和能发现任意形状的簇等优点,在聚类分析中被广泛采用。提出的基于相对密度的聚类算法,在继承上述优点的基础上,有效地解决了基于密度的聚类结果对参数值过于敏感、参数值难以设置以及高密度簇完全被相连的低密度簇所包含等问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号