期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张红云石阳马垣《辽宁科技大学学报》2001,24(5)

聚类算法是数据挖掘中的核心技术,虽然聚类算法已被广泛深入的研究,但其应用在数据挖掘领域时间不长,其间产生了许多不同的适用于数据挖掘的聚类算法,但这些算法仅适用于特定的问题及用户.为了更好的使用这些算法,综合提出了评价聚类算法好坏的5个标准,基于这5个标准,对数据挖掘中近几年提出的常用聚类方法作了比较分析,以利于人们更容易、更快速的找到一种适用于特定问题的聚类算法. 相似文献

2.

数据挖掘中聚类算法比较研究

张红云石阳马垣《鞍山科技大学学报》2001,24(5):364-367,371

聚类算法是数据挖掘中的核心技术 ,虽然聚类算法已被广泛深入的研究 ,但其应用在数据挖掘领域时间不长 ,其间产生了许多不同的适用于数据挖掘的聚类算法 ,但这些算法仅适用于特定的问题及用户 .为了更好的使用这些算法 ,综合提出了评价聚类算法好坏的 5个标准 ,基于这 5个标准 ,对数据挖掘中近几年提出的常用聚类方法作了比较分析 ,以利于人们更容易、更快速的找到一种适用于特定问题的聚类算法相似文献

3.

数据挖掘常用聚类算法

臧少杰《科技信息》2007,(30):75-75,74

聚类算法是数据挖掘的核心技术,本文提出了评价聚类算法好坏的标准,基于这个标准,对数据挖掘中常用聚类算法作了比较分析,以便于人们更容易、更快捷地找到一种适用于特定问题的聚类算法。相似文献

4.

一种基于密度的网格动态聚类算法的研究

焦誉赖建章柯佳《安徽大学学报(自然科学版)》2007,31(1):31-34

聚类算法是数据挖掘领域中一个非常重要的研究方向.至今为止人们已经提出了许多适用于大规模的、高维的数据库的聚类算法.基于密度的聚类算法是其中一个比较典型的研究方向,文中以DBSCAN为基础,提出一种基于密度的网格动态聚类算法.新算法将网格的原理运用到基于密度的聚类算法中,并采用了动态的参数法,能自动根据数据的分布情况进行必要的参数更改,有效减少DBSCAN对初始参数的敏感度,从而提高了聚类的效率和效果,降低了算法I/O的开销.算法不仅能挖掘出各种形状的聚类,并能准确的挖掘出数据集中突出的聚类. 相似文献

5.

基于人工蜂群算法的数据流聚类研究

《首都师范大学学报(自然科学版)》2015,(6)

聚类是数据挖掘领域非常重要技术之一,能发现数据中隐含的知识和价值,在数据流分析中有重要的意义.针对现有数据流聚类算法的不足,根据数据流特点提出了一种高效、可扩展的数据流聚类算法ABCClu Stream.该算法借鉴了经典Clu Stream算法的在线—离线两阶段框架,根据蜂群算法的相关理论定义聚类过程中相关的参数、微簇聚类特征结构等,设计出了一种全新的算法.通过实验表明,本文所设计出的ABCClu Stream算法具有聚类纯度高、可扩展性好的特点,能够产生高质量的聚类结果,适用于大规模的动态数据流聚类的分析和研究. 相似文献

6.

数据挖掘中聚类分析技术方法的比较研究

任春美孔磊《科技信息》2008,(24)

聚类是数据挖掘领域中的一个重要研究课题.聚类在电子商务、图像处理、模式识别、文本分类等领域有广泛的应用.本文首先建立了数据挖掘中聚类方法的比较标准,然后从基于优化、关系、变换这样一个新的角度对聚类方法进行了分类和比较,最后对数据挖掘中常用聚类算法进行了分析,以便于人们更易于选择研究方向和选择适合于具体问题的聚类算法. 相似文献

7.

浅谈数据挖掘中的聚类算法

赵晨钱伟强张飞雁《中国新技术新产品精选》2009,(22):45-45

数据挖掘是近年来非常热门的研究方向。聚类分析是数据挖掘的一个重要研究领域。本文归纳总结了数据挖掘中传统聚类算法,并对现今新发展的,比较热门的聚类算法进行了介绍。相似文献

8.

网络流聚类算法及其在图像处理中的应用

宗瑜金萍《皖西学院学报》2005,21(5):108-112

聚类分析是重要的数据挖掘技术，在科学研究、工程应用等领域有着广泛的应用背景。由于经典聚类算法的时间复杂度高、聚类质量低，因此不适合处理图像分析。本文提出的网络流聚类算法则是一种新型的图像信息分析的算法，它适用于图像分析、分割和聚类，并且具有线性的算法时间复杂度。相似文献

9.

数据挖掘中数据流聚类算法的分析和比较

王斌《科技咨询导报》2009,(34):33-33

本文对数据挖掘中的数据流聚类算法进行分析，首先简要介绍了数据挖掘以及流数据数据挖掘的，在此基础上提出数据流聚奏算法应具备的特殊要求，并对常见的数据流聚类算法进行分析和比较。相似文献

10.

联机增量聚类算法研究

徐雄王锁萍曹磊《南京邮电大学学报(自然科学版)》2004,24(4):17-19

研究了联机数据挖掘系统中的并行和增量聚类算法,并给出了算法伪码。实验表明,联机增量聚类算法相对于传统的Apriori算法具有较大优势,同时证明了增量聚类算法及其联机数据挖掘系统的实用性。相似文献

11.

聚类算法在电信客户细分中应用效果的对比研究

成娅辉张英杰《邵阳学院学报(自然科学版)》2009,6(4):69-73

聚类算法是数据挖掘中的一个重要研究领域,是一种数据划分或分组处理的重要手段和方法．目前其研究已深入到数据库、数据挖掘、统计等领域并取得了很大的成绩。但是由于聚类算法的多样性,使其在很多行业应用中有着不同的应用效果,基于此。本文通过聚类算法三种指标的比较,给出了一种聚类方法应用效果评估的方法．该方法结合电信的案例应用与K-Means、SOM、BIRCH等聚类方法结果的分析,最后得出K-Means方法在电信客户细分中的应用优越性．相似文献

12.

一个基于K-means的聚类算法的实现 总被引：9，自引：0，他引：9

谭勇荣秋生《湖北民族学院学报(自然科学版)》2004,22(1):69-71

聚类算法作为数据挖掘中的一种分析方法，它能找到样本比较密集的部分，并且概括出样本相对比较集中的区域．分析了传统的聚类算法及局限性，讨论了一个基于K-mealls算法的实现过程，使得算法可处理存在孤立点的大文档集，得到最佳的聚类结果。相似文献

13.

空间聚类在精准施肥中应用的研究

李晓宁李晓峰《长春师范学院学报》2008,27(5):33-34

空间聚类分析是聚类领域的一个研究方向,聚类研究是数据挖掘领域的一个重要的研究分支。通过介绍空间聚类分析在精准施肥过程中的应用,具体讨论了两种方法BIRCH与Wavecluster在精准施肥中的使用情况,并分析了这两种方法在精准施肥领域使用过程的特点与差异。相似文献

14.

基于树形结构的Web信息抽取

任仲晟薛永生《福建师范大学学报(自然科学版)》2009,25(3)

提出了一种基于树形结构的Web结构化数据抽取算法.该算法基于HTML的树形层次结构,包括HTML树构造算法,数据区域挖掘算法,数据记录挖掘算法以及数据记录模式生成算法.算法引入了页面元素布局位置等信息用于清洗页面,采用层次划分思想实现页面数据区域的挖掘,并通过树匹配生成记录模式,实现最终数据项抽取.实验表明,该方法可以有效地实现Web结构化数据抽取. 相似文献

15.

一种基于自组织分级聚类的数据挖掘方法

杨天奇《暨南大学学报(自然科学与医学版)》2005,26(5):617-621

针对传统自组织聚类方法处理数据在多维空间中存在多样性和从基本或低层次概念上发现强关联规则中的不足，提出了一种基于自组织分级聚类的数据挖掘方法．该方法采用最大似然分类自组织特征网络（MAXNET）聚类过程，利用自下而上聚合层次聚类方法，对有畸变的二值化输入模式作最大似然分类．最后对一个销售电脑商场中，与任务相关的交易数据集进行了分析，描述了从低层次概念到高层次概念的相互关系．并用matlab仿真软件把该方法和传统方法进行比较，表明了该方法的有效性．相似文献

16.

基于方差优化谱聚类的热点区域挖掘算法

下载免费PDF全文

梁卓灵元昌安覃晓《广西科学》2020,27(6):616-621

为改善交通拥堵的情况,本文利用聚类分析方法对移动轨迹数据进行挖掘,识别居民出行的热点区域。传统的Ng-Jordan-Weiss （NJW）谱聚类算法常使用K-means聚类算法来实现最后的聚类操作,然而K-means聚类算法存在对初始值敏感、容易陷入局部最优的缺陷,影响对热点区域的挖掘结果。因此,本研究将方差优化初始中心的K-medoids聚类算法运用到谱聚类算法最后聚类阶段,提出基于方差优化谱聚类的热点区域挖掘算法（Hot Region Mining algorithm based on improved K-medoids Spectral Clustering,HRM-KSC）,然后在真实的轨迹数据集上进行试验。试验结果发现,HRM-KSC算法聚类结果的轮廓系数更高,表明HRM-KSC算法改善了NJW谱聚类算法,提高了聚类质量。相似文献

17.

数据挖掘中K-均值聚类算法的缺陷及工作效率改进的实验研究

陈晓勇顾晖彭志娟《科学技术与工程》2013,13(34)

K -均值聚类算法在当前提取数据挖掘的聚类分析方法中已经取得了一定的成就,为了进一步改进其在数据预处理及神经网络结构中的应用,文中对算法进行了缺陷研究,主要做了以下几个方面的工作：对K-means算法进行了思路及算法主要流程分析;得出K-均值聚类算法存在简单、迅速、结果簇密集、簇与簇之间区别较为明显等优点;分析得出算法存在与处理符号属性的数据不太适应、必须事先给出k值(想要生成的簇的个数)、对“噪声数据”以及孤立的点数据有较大影响、需要不断计算更新调整后的新聚类中心等缺点。在实验验证中结果得出：聚类结果可知,选取不同的值初始值对聚类结果的影响很小;如果聚类数据集迭代次数较多时,可以尝试着改变其数据的输入顺序;变动数据集的输入顺序,会直接影响聚类结果。实验结果对于K-均值算法的工作效率提高了具有明显的参考价值,这一研究对于数据挖掘技术的改进具有一定的意义。相似文献

18.

基于网格聚类算法的电力营销预测研究

罗静刘宗歧《科技信息》2011,(13):366-367

本文阐述了数据挖据的一些主要的方法和技术,详细介绍了基于网格的聚类技术,采用foodmart数据库作为算法输入的数据集,应用基于网格距离的聚类算法的实现对电力营销中客户的购买行为进行了聚类和预测,并验证了算法的正确性和有效性。相似文献

19.

基于模糊神经网络的高光谱数据挖掘方法

李俊兵李兴军《孝感学院学报》2003,23(6):68-71

分析了高光谱影像的数据特性，应用模糊聚类方法构造模糊神经网络，并将其结合进数据挖掘，对高光谱数据进行数据处理。相似文献

20.

基于访问兴趣度的用户事务聚类方法

苏云辉张莹白清源谢丽聪谢伙生《广西师范大学学报(自然科学版)》2007,25(4):248-251

针对现有事务聚类算法复杂度高、精确性不够的问题,提出了基于用户访问兴趣度的事务聚类算法。首先,在Web日志预处理阶段,通过用户兴趣度生成算法得到用户兴趣度事务,减少了聚类操作的数量,提高了聚类结果的准确性;其次,给出了事务相似度的度量方法,并得到事务相似度矩阵以实现事务聚类。该算法减轻了数据挖掘的任务,提高聚类结果的准确性,能广泛地应用于电子商务领域。相似文献