首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 312 毫秒
1.
数据挖掘是一种新兴的信息处理技术,模糊聚类是数据挖掘领域中的一个重要研究课题。论文从数据挖掘的概念出发,研究分析了模糊聚类的主要算法,并从多个方面对这些算法性能进行比较,同时还对模糊聚类分析在数据挖掘中的应用进行了阐述,最后对模糊聚类的研究领域进行了总结和展望。  相似文献   

2.
聚类是数据挖掘领域中的一个重要研究课题.聚类在电子商务、图像处理、模式识别、文本分类等领域有广泛的应用.本文首先建立了数据挖掘中聚类方法的比较标准,然后从基于优化、关系、变换这样一个新的角度对聚类方法进行了分类和比较,最后对数据挖掘中常用聚类算法进行了分析,以便于人们更易于选择研究方向和选择适合于具体问题的聚类算法.  相似文献   

3.
聚类算法是数据挖掘中的核心技术,虽然聚类算法已被广泛深入的研究,但其应用在数据挖掘领域时间不长,其间产生了许多不同的适用于数据挖掘的聚类算法,但这些算法仅适用于特定的问题及用户.为了更好的使用这些算法,综合提出了评价聚类算法好坏的5个标准,基于这5个标准,对数据挖掘中近几年提出的常用聚类方法作了比较分析,以利于人们更容易、更快速的找到一种适用于特定问题的聚类算法.  相似文献   

4.
聚类算法是数据挖掘中的核心技术 ,虽然聚类算法已被广泛深入的研究 ,但其应用在数据挖掘领域时间不长 ,其间产生了许多不同的适用于数据挖掘的聚类算法 ,但这些算法仅适用于特定的问题及用户 .为了更好的使用这些算法 ,综合提出了评价聚类算法好坏的 5个标准 ,基于这 5个标准 ,对数据挖掘中近几年提出的常用聚类方法作了比较分析 ,以利于人们更容易、更快速的找到一种适用于特定问题的聚类算法  相似文献   

5.
在数据挖掘的实现过程中,聚类分析已经成为数据挖掘研究领域中一个非常活跃的研究课题。聚类是数据挖掘中一种重要的挖掘方法,它从数据库中计算发现数据中隐舍的有用信息或知识,数据聚类在很多领域中有着广泛的应用。该文研究的主要内容是数据聚类算法在Web数据挖掘中的应用,获得的聚类结果可以作为web网站结构的优化,站点的重构以及个性化的服务和推荐的重要依据。  相似文献   

6.
叶炼炼 《科技信息》2009,(33):I0045-I0046
本文设计一种基于数据挖掘的路由监测系统。系统通过被动的监听模式对网络数据进行采集。通过数据挖掘实现实时网络拓扑生成、拓扑比较等功能。为了提高数据挖掘的效率,改善路由监测系统的性能,本文还对数据挖掘中的聚类算法进行了深入的研究,根据超大网络数据集的特点,提出了一种K-Means算法的改进算法。  相似文献   

7.
徐向阳  司智勇 《河南科学》2007,25(4):644-647
聚类是当今数据挖掘领域中最为流行的方法之一,已广泛应用于统计领域、数据库领域、人工智能领域等.着重论述了把K-均值聚类算法应用在关系数据库磁盘文件中的一种思想,允许K-均值方法对磁盘的大数据集进行聚集.  相似文献   

8.
在数据挖掘领域,聚类用于发现数据的分布模式和数据间的相互关系.作者提出一种分层聚类算法,可识大规模、高维数据.该算法首先从不同的角度对电信客户进行聚类或分类,然后以这些聚类为基础,实行自底向上的层次聚类得到最终的聚类结果.算法执行效率高,适合大规模数据的聚类问题.该方法在某电信企业的客户分析中取得了较好的结果.  相似文献   

9.
灰色系统理论是研究贫信息系统分析、建模、预测、决策、控制的有效工具,在工程技术、社会、经济等领域中应用广泛,该文探讨了灰色系统理论在数据挖掘中的应用问题,提出了数据挖掘的灰色关联算法、灰色统计算法、灰色聚类算法、灰色统计聚类算法,并提出了灰色数据挖掘系统的体系结构。  相似文献   

10.
数据挖掘领域中的聚类方法   总被引:4,自引:0,他引:4  
聚类算法是数据挖掘中的核心技术,随着对聚类算法广泛深入的研究,产生了许多不同的适用于数据挖掘的聚类算法;文章从算法的角度论述了如何在数据挖掘中进行聚类分析,并通过基于评价聚类算法好坏的8个标准,对数据挖掘中近几年提出的常用聚类方法作了比较分析,以利于人们更容易、更快速的找到一种适用于特定问题的聚类算法.  相似文献   

11.
针对结构面产状常规分类方法存在的不足,提出一种新型的结构面分类算法.基于K-Means算法的结构面分类,将人工鱼群算法(artificial fish swarm algorithm,AFSA)与K-Means算法相结合,建立了AFSA-RSK结构面分类算法.利用鱼群算法强大的寻优能力,代替K-Means算法对结构面产状聚心集进行搜寻,并通过K-Means算法进行聚类.聚类完成后,选择相应参数指标对聚类效果进行评价.针对存在的问题,对鱼群算法的步长和视野进行修正,提高寻找聚心集的精度,动态地调整了聚类过程.将改进后的AFSA-RSK算法与其他算法进行比较,结果表明在迭代速度、聚类精度以及内存占比上,改进后的AFSA-RSK算法都要更优,更适合在结构面分组方面的应用.  相似文献   

12.
 空间聚类和空间索引的结合是当前空间数据库中提高数据检索效率的技术之一。本文从空间聚类和空间索引的存储原理入手,阐述了K-Means聚类算法及其改进算法的技术思路,研究了K-Means算法在空间数据库中与空间索引方法结合的技术问题;分析了当前基于K-Means算法的R-树系列空间索引技术的研究成果,阐述了它们提高空间检索效率的技术路线及实验结果,研究显示这些技术都能在一定程度上提高数据检索的效率。最后给出了聚类与空间索引结合技术未来的研究方向。  相似文献   

13.
针对传统K均值算法中采取的欧氏距离计算相似性的不足,提出一种新的相似性计算方法,并将这种方法与欧氏距离的度量方法进行了比较。在UC I基准数据集上的实验表明,该方法有更稳定的聚类结果,是一种比较有效的聚类度量方法。  相似文献   

14.
针对公路裂缝检测中的图像分割问题,运用机器学习领域的方法,以裂缝图像为研究对象,在深入分析经典K-Means聚类算法以及高斯混合模型(Gaussian Mixture Model, GMM)之后,提出一个利用全局K-Means和高斯混合模型来对公路裂缝图像进行分割的方法。该方法在全局K-Means聚类算法的基础上,采用改进策略,同时,将传统GMM的每一个概率分布,进一步再细分成单个的概率成分,在辅助变量计算过程中,采用EM算法。仿真图像和实际裂缝图像实验结果显示,本研究得到了比使用传统K-Means算法和普通GMM的分割方法精度更高、稳定性更好的分割结果。  相似文献   

15.
空间聚类分析是聚类领域的一个研究方向,聚类研究是数据挖掘领域的一个重要的研究分支。通过介绍空间聚类分析在精准施肥过程中的应用,具体讨论了两种方法BIRCH与Wavecluster在精准施肥中的使用情况,并分析了这两种方法在精准施肥领域使用过程的特点与差异。  相似文献   

16.
关联规则的研究是近几年研究较多的数据挖掘方法,在数据挖掘的各种方法中应用也最为广泛。在生产性企业的营销决策支持系统中应用关联规则挖掘数据,通过优化原有的算法可以提高算法效率,有效地得出有价值的规则,从而有力地支持了营销管理者的决策。  相似文献   

17.
提出一种MapReduce框架下基于抽样的分布式K-Means聚类算法,解决海量数据环境下并行执行K-Means算法时,时间开销较大的问题.该算法使用抽样方法,在保证数据分布不变的前提下,对数据集的规模进行约减,并在MapReduce框架下对聚类算法进行优化.实验结果表明,该算法在保持良好聚类效果的同时,能有效缩短聚类时间,对大规模数据集具有较高的执行效率和较好的可扩展性.  相似文献   

18.
为了解决模糊关联规则挖掘算法需要用户事先给定模糊集和相应隶属度函数的问题,提出基于分布式聚类自动生成模糊集及隶属度函数的算法GFAM.该算法利用分布式K-Means聚类算法对每个数值型属性进行聚类,求得聚类中心,由此构造全局模糊集,定义全局隶属度函数.DFAR算法根据构造的全局模糊集及隶属度函数进行分布式模糊频繁项目集的快速挖掘,采用全局-局部站点模式,其中包括局部模糊频繁项目集产生算法FLF和全局模糊频繁项目集产生算法FGF.实验结果表明,该算法能准确地生成全局模糊频繁项目集,在求解全局模糊频繁项目集过程中,传送局部模糊候选项目集支持数的通信量为O(n),提高了算法的挖掘效率.  相似文献   

19.
基于集群环境的K-Means聚类算法的并行化   总被引:1,自引:1,他引:0  
K-Means聚类算法在面对海量数据时,时间和空间的复杂性已成为K-Means聚类算法的瓶颈.在充分研究传统K-Means聚类算法的基础上,提出了基于集群环境的并行K-Means聚类算法的设计思想,给出了其加速比估算公式,并通过实验证明了该算法的正确性和有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号