期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

胡俊黄厚宽高芳《南京大学学报(自然科学版)》2009,(5)

本文说明了数据挖掘中可视化技术应用的特点与方法,给出了数据挖掘中可视对象与参数的确定及算法分解的方法,并给出基于平行坐标技术的聚类算法的可视化方法与平行坐标的度量模型,以及在K-means算法上的应用方法.结果表明这种方法对于数据及聚类算法K-means的数据挖掘过程的可视化表示是有效的. 相似文献

2.

数据挖掘领域中的聚类方法 总被引：4，自引：0，他引：4

王美华《南华大学学报(自然科学版)》2004,18(1):58-62

聚类算法是数据挖掘中的核心技术,随着对聚类算法广泛深入的研究,产生了许多不同的适用于数据挖掘的聚类算法;文章从算法的角度论述了如何在数据挖掘中进行聚类分析,并通过基于评价聚类算法好坏的8个标准,对数据挖掘中近几年提出的常用聚类方法作了比较分析,以利于人们更容易、更快速的找到一种适用于特定问题的聚类算法. 相似文献

3.

数据挖掘常用聚类算法

臧少杰《科技信息》2007,(30):75-75,74

聚类算法是数据挖掘的核心技术,本文提出了评价聚类算法好坏的标准,基于这个标准,对数据挖掘中常用聚类算法作了比较分析,以便于人们更容易、更快捷地找到一种适用于特定问题的聚类算法。相似文献

4.

浅谈数据挖掘中的聚类算法

赵晨钱伟强张飞雁《中国新技术新产品精选》2009,(22):45-45

数据挖掘是近年来非常热门的研究方向。聚类分析是数据挖掘的一个重要研究领域。本文归纳总结了数据挖掘中传统聚类算法,并对现今新发展的,比较热门的聚类算法进行了介绍。相似文献

5.

一种改进的K均值聚类算法

王林吴海桥郑友石《科技信息》2010,(32):I0136-I0137

K均值算法是聚类方法中常用的一种划分方法,有很多优点,但也存在不足之处,它对球状、凸形分布的数据具有很好的聚类效果,但对样本的输入顺序敏感,可能产生局部最优解,而且受孤立点影响比较大。本文针对这些不足之处,主要从数据预处理。初始聚类中心的选择和迭代过程聚类种子计算三方面进行改进,并做了改进前后算法的对比实验。结果表明,改进后的算法比原k均值算法具有更高的准确性,受孤立点的影响也大大降低。相似文献

6.

基于维约束的平行坐标可视化及其在数据聚类中的应用

下载免费PDF全文

高飞樊明辉关玉梅陈崇成《福州大学学报(自然科学版)》2007,35(2):196-200

平行坐标可视化是数据可视化方法中的典型代表.在平行坐标法可视化的基本原理的基础上,实现了在数据可视化过程中嵌入维度限制条件,探讨了在维约束条件下的平行坐标可视化技术.以海洋监测台站数据为例,开发了DBSCAN聚类算法,并利用平行坐标对聚类的结果进行可视化表达. 相似文献

7.

基于平行坐标的信息可视化方法的应用研究 总被引：1，自引：0，他引：1

谭桂龙陈谊《北京工商大学学报(自然科学版)》2008,26(2):75-80

基于平行坐标和聚类理论,通过采用数学模型定义平行坐标,使用编程工具建立平行坐标系统,解决了如何显示多维数据集的问题,结合系统聚类法,解决了平行坐标维数过多或数据量过大时,平行坐标屏幕限制、折线重叠、不易于发现各维间的隐含关系等问题,达到用可视化方法协助医生分析客户的健康状况分布,及其健康发展趋势的目的. 相似文献

8.

聚类算法在数据挖掘领域的研究

蔡程宇娄渊胜《哈尔滨商业大学学报(自然科学版)》2015,(2):237-241

全方位的对各类聚类算法进行总结和归纳,并且对一些在特殊领域中应用聚类算法进行深度解析,然后从以下三个部分,算法思想,关键技术以及算法特点等方面进行基本概括,对一些代表性的聚类算法进行比较分析以及聚类算法新领域研究的展望,这对将来聚类发展具有重大意义. 相似文献

9.

数据挖掘中聚类算法比较研究

张红云石阳马垣《鞍山科技大学学报》2001,24(5):364-367,371

聚类算法是数据挖掘中的核心技术 ,虽然聚类算法已被广泛深入的研究 ,但其应用在数据挖掘领域时间不长 ,其间产生了许多不同的适用于数据挖掘的聚类算法 ,但这些算法仅适用于特定的问题及用户 .为了更好的使用这些算法 ,综合提出了评价聚类算法好坏的 5个标准 ,基于这 5个标准 ,对数据挖掘中近几年提出的常用聚类方法作了比较分析 ,以利于人们更容易、更快速的找到一种适用于特定问题的聚类算法相似文献

10.

数据挖掘中聚类算法比较研究

张红云石阳马垣《辽宁科技大学学报》2001,24(5)

聚类算法是数据挖掘中的核心技术,虽然聚类算法已被广泛深入的研究,但其应用在数据挖掘领域时间不长,其间产生了许多不同的适用于数据挖掘的聚类算法,但这些算法仅适用于特定的问题及用户.为了更好的使用这些算法,综合提出了评价聚类算法好坏的5个标准,基于这5个标准,对数据挖掘中近几年提出的常用聚类方法作了比较分析,以利于人们更容易、更快速的找到一种适用于特定问题的聚类算法. 相似文献

11.

一种基于自组织分级聚类的数据挖掘方法

杨天奇《暨南大学学报(自然科学与医学版)》2005,26(5):617-621

针对传统自组织聚类方法处理数据在多维空间中存在多样性和从基本或低层次概念上发现强关联规则中的不足，提出了一种基于自组织分级聚类的数据挖掘方法．该方法采用最大似然分类自组织特征网络（MAXNET）聚类过程，利用自下而上聚合层次聚类方法，对有畸变的二值化输入模式作最大似然分类．最后对一个销售电脑商场中，与任务相关的交易数据集进行了分析，描述了从低层次概念到高层次概念的相互关系．并用matlab仿真软件把该方法和传统方法进行比较，表明了该方法的有效性．相似文献

12.

一种分层聚类方法及其应用研究

罗菲菲刘贵全安景琪张婷慧《成都理工大学学报(自然科学版)》2005,32(6):649-652

在数据挖掘领域,聚类用于发现数据的分布模式和数据间的相互关系.作者提出一种分层聚类算法,可识大规模、高维数据.该算法首先从不同的角度对电信客户进行聚类或分类,然后以这些聚类为基础,实行自底向上的层次聚类得到最终的聚类结果.算法执行效率高,适合大规模数据的聚类问题.该方法在某电信企业的客户分析中取得了较好的结果. 相似文献

13.

Image Post-Processing Method for Visual Data Mining

REN Yong-gong YU Ge 《武汉大学学报:自然科学英文版》2006,11(1):15-20

Visual data mining is one of important approach of data mining techniques. Most of them are based on computer graphic techniques but few of them exploit image-processing techniques. This paper proposes an image processing method, named RNAM （resemble neighborhood averaging method）, to facilitate visual data mining, which is used to post-process the data mining result-image and help users to discover significant features and useful patterns effectively. The experiments show that the method is intuitive, easily-understanding and effectiveness. It provides a new approach for visual data mining. 相似文献

14.

基于K-means聚类算法的研究

步媛媛关忠仁《西南民族学院学报(自然科学版)》2009,35(1):198-200

原始的k-means算法是从样本点的集合中随机选取K个中心,这种选取具有盲目性和随意性,它在很大程度上决定了算法的有效性．为消除选取初始中心的盲目性,应充分利用已有数据样本点的信息．采取对数据进行预处理的方式来选取初始中心．实验证明新的初始点的选取不仅提高了算法的计算效率,也提高了算法最终确定的聚类的精度．相似文献

15.

基于非结构化数据挖掘结构模型的Web文本聚类算法

胡健杨炳儒宋泽锋钱榕《北京科技大学学报》2008,30(2):217-220

在非结构化数据挖掘结构模型——发现特征子空间模型(DFSSM)——的运行机制下,提出了一种新的Web文本聚类算法——基于DFSSM的Web文本聚类(WTCDFSSM)算法.该算法具有自稳定性,无须外界给出评价函数;能够识别概念空间中最有意义的特征,抗噪声能力强.结合现代远程教育网应用背景实现了WTCDFSSM聚类算法.结果表明:该算法可以对各类远程教育站点上收集的文本资料信息自动进行聚类挖掘;采用网格结构模型,帮助人们进行文本信息导航;从海量文本信息源中快速有效地获取重要的知识. 相似文献

16.

基于信息熵改进的 K-means 动态聚类算法 总被引：3，自引：2，他引：1

杨玉梅《重庆邮电大学学报(自然科学版)》2016,28(2):254-259

初始聚类中心及聚类过程产生的冗余信息是影响K-means算法聚类性能的主要因素,也是阻碍该算法性能提升的主要问题.因此,提出一个改进的K-means算法.改进算法通过采用信息熵对聚类对象进行赋权来修正聚类对象间的距离函数,并利用初始聚类的赋权函数选出质量较高的初始聚类中心点;然后,为算法的终止条件设定标准阈值来减少算法迭代次数,从而减少学习时间;最后,通过删除由信息动态变化而产生的冗余信息来减少动态聚类过程中的干扰,以使算法达到更准确更高效的聚类效果.实验结果表明,当数据样本数量较多时,相比于传统的K-means算法和其他改进的K-means算法,提出的算法在准确率和执行效率上都有较大提升. 相似文献

17.

属性受限状态下低维冗余聚类数据快速挖掘方法研究

梁燕红《科学技术与工程》2018,18(9)

针对传统数据挖掘方法存在挖掘精度低、速度慢、占用内存多而不适于实际应用等缺点,提出一种属性受限状态下低维冗余聚类数据挖掘方法。通过计算低维冗余聚类数据的支持度,把低维冗余聚类数据挖掘问题转变成频繁项集挖掘问题;利用支持度与可信度对关联规则产生结果进行评价,并添加属性对其进行限制,以减少无用规则的产生。通过属性位复用方法建立候选区域,产生关联规则集,对符合关联规则集的低维冗余数据进行聚类,实现对其挖掘。实验结果表明,通过所提方法对属性受限状态下低维冗余数据进行挖掘,挖掘速度快,结果可靠。相似文献

18.

基于Web使用挖掘的实时聚类算法

邓晶晶蒋玉明傅静涛《四川大学学报(自然科学版)》2007,44(4):803-806

本文讨论了基于Web使用挖掘的Web个性化技术,针对个性化系统的功能及特点,论述了相关数据采集、数据预处理技术和模式发现及其在个性化服务中的应用,提出了一个关于个性化系统的实时聚类算法.实验结果表明,该算法不仅有效,而且具有较高的准确度,能适应用户短期浏览的变化. 相似文献