首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
本论述对低保数据的挖掘中,使用了两种挖掘算法,另外配合SQL Server 2010提供的数据挖掘功能对低保数据进行了全面的分析,介绍了OLAP技术和数据挖掘在低保数据分析中的应用.主要内容包括:分析了数据挖掘技术在低保数据分析中的应用意义;研究了关联规则、决策树算法、聚类分析在低保数据分析中的应用.这也是低保信息化工作今后重要的研究目标和发展方向.  相似文献   

2.
讨论基于数据规约的近似挖掘技术,在数据预处理阶段对海量数据集进行数据规约.近似数据挖掘的工作流程包括任务定义、数据准备与预处理、数据挖掘建模、结果的解释与评估、模型发布与应用5个阶段.同时,提出使用属性选择和实例选择方法实现近似挖掘的方案,并对该方案进行挖掘效率和结果模型准确性的分析评估.该方案能满足对企业级大数据集进行高效挖掘的需要.  相似文献   

3.
分析了大数据环境下的O2O电商用户数据特征,提出O2O电商用户数据挖掘框架,并探讨数据挖掘流程和主要的数据挖掘方法,分别从O2O电商平台、O2O用户和O2O商家三者角度探讨了O2O电商用户数据挖掘的应用问题.研究认为:O2O用户数据挖掘框架包括数据来源层、数据收集层、数据组织层、数据分析层与数据应用层等层级;数据挖掘流程主要包括数据收集、数据预处理、数据挖掘及数据应用4个过程;O2O电商用户数据的挖掘应用包括精准营销、平台网站优化、欺诈分析与防范、个性化推荐、增值服务开发与产品创新等方面.  相似文献   

4.
沙倩 《科技信息》2008,(11):23-23
数据挖掘是近几年迅速发展起来的技术,主要用于构建企业的决策支持系统。文章根据数据挖掘技术的特点,针对传统ERP系统在决策方面的不足,提出把数据挖掘应用到ERP中去,并结合A汽车公司的ERP系统的实施和运行情况,开展从该系统挖掘数据的可行性研究、数据方法和流程探索,给出决策树挖掘算法检测数据挖掘模型。结果表明,这种数据挖掘是有效的。  相似文献   

5.
基于Web的数据挖掘是一种结合了数据挖掘和互联网系统的热门研究课题。本文综述了Web数据挖掘的主要方法、Web数据挖掘的主要过程,在此基础上又着重介绍了Web数据挖掘技术在电子商务中的具体应用。  相似文献   

6.
随着信息技术的高速发展,数据挖掘技术在价值的利用上被充分分析使用,与传统的数据分析之间挖掘数据更具有合理有效性。挖掘的方法和传统数据处理系统方式上相同,但对挖掘的结果不易理解,在对数据分析上没有高效的处理措施。挖掘过程中应根据实际有价值的发现进行研究分析,结合数据挖掘的案例分析对挖掘技术的发展进行展望,探究数据挖掘的前景规划。  相似文献   

7.
介绍了应用于森林资源二类调查的数据挖掘系统,以实例说明关联规则挖掘方法在林业中的具体应用。研究了数据挖掘技术中的关联规则理论在林木属性分析中的应用,应用Apriori算法分析了权属、起源、年龄、平均胸径、树高、郁闭度之间的关联,为相关的决策支持提供参考。证明了数据挖掘在森林资源调查数据分析中具有良好的应用前景。  相似文献   

8.
基于WEB的数据挖掘研究综述   总被引:5,自引:0,他引:5  
运用数据挖掘技术进行Web数据挖掘成为数据分析领域中的一个重要研究热点,与传统数据相比较,Web数据具有结构复杂、形式多样与内容广泛等特点,且用户对其需求亦是五花八门的,这对数据分析领域提出了更大的挑战.基于为研究Web数据挖掘提供参考,将Web数据挖掘粗略地分为三类:内容挖掘、结构挖掘和使用挖掘,并分别进行了综述,然后根据当前的应用现状分析了这一研究领域的几个研究方向.  相似文献   

9.
数据挖掘是致力于数据分析和理解、揭示数据内部蕴藏知识的技术,它成为未来信息技术应用的重要目标之一。本文对数据挖掘的概念、算法、使用的技术、实际的挖掘过程及其发展趋势进行了论述。  相似文献   

10.
Web日志挖掘中数据预处理技术研究   总被引:2,自引:0,他引:2  
Web日志挖掘的基本思想是将数据挖掘技术应用于Web日志数据源。在数据挖掘研究领域中,数据预处理起着至关重要的作用。Web日志挖掘的数据源最主要的是Web日志,根据Web日志的特点,在预处理过程中的会话识别阶段给出一种基于过滤框架网页与页面访问时间阈值相结合的会话识别方法,实验数据验证说明该方法可以显著地提高Web日志挖掘结果的兴趣性。  相似文献   

11.
山体下采煤的地面监测包括常规的山区地表移动监测及采动引起滑坡的监测。本文将采动山体变形划分为3个阶段并提出相应的变形监测方案;讨论了采动山体滑坡监测网的设计原则及观测方法;提出了采动山体变形监测数据分析和采动引起滑坡的预报方法。  相似文献   

12.
数据挖掘技术及应用工具研究   总被引:1,自引:0,他引:1  
基于国内外的最新研究成果对数据挖掘技术的工具和方法论进行了综述,提供了数据挖掘方法的基本流程,对目前比较成熟的挖掘工具进行了介绍和应用性能上的比较分析.并对数据挖掘技术的应用进行了积极的评价.最后讨论了数据挖掘系统的发展趋势和研究方向。  相似文献   

13.
数据挖掘是通过对大量数据进行分析,采用多种分析方法发现其中未知和有用规律的过程,在“数字城市”建设中对海量的多元空间数据的挖掘是极其重要的和极具价值的,具有广阔的应用前景,对“数字城市”建设中的多元空间数据挖掘的步骤、挖掘方法进行了分析,对多元空间数据挖掘在城市规划管理平台、城市可持续发展信息平台、城市经济信息平台等方面的应用进行了讨论。  相似文献   

14.
信息可视化研究综述   总被引:4,自引:0,他引:4       下载免费PDF全文
信息可视化是可视化技术在非空间数据领域的应用,可以增强数据呈现效果,让用户以直观交互的方式实现对数据的观察和浏览,从而发现数据中隐藏的特征、关系和模式。可视化应用非常广泛,主要涉及领域:数据挖掘可视化、网络数据可视化、社交可视化、交通可视化、文本可视化、生物医药可视化等等。根据CARD可视化模型可以将信息可视化的过程分为以下几个阶段:数据预处理;绘制;显示和交互。根据SHNEIDERMAN的分类,信息可视化的数据分为以下几类:一维数据、二维数据、三维数据、多维数据、时态数据、层次数据和网络数据。其中针对后4种数据的可视化是当前研究的热点。多维数据可视化方法主要包括基于几何的方法、图标方法和动画方法等。基于几何的可视化方式中最经典的就是"平行坐标系"方法。平行坐标系(parallel coordinates)使用平行的竖直轴线来代表维度,通过在轴上刻划多维数据的数值并用折线相连某一数据项在所有轴上的坐标点展示多维数据。平行坐标系方法能够简洁、快速地展示多维数据,发展出很多改进技术。但是当数据集的规模变得非常大时,密集的折线会引起"视觉混淆"(visual clutter),处理方法包括维度重排、交互方法、聚类、过滤、动画等。其他基于几何的方法包括Radviz方法使用圆形坐标系展示可视化结果;散点图矩阵(scatter plot matrix)将多维数据中的各个维度两两组合绘制成一系列的按规律排列的散点图。基于图标的可视化方法用具备可视特征的几何形状如大小、长度、形状、颜色等刻划数据,代表性的方法包括星绘法和Chernoff面法等。动画方法用于可视化中可被用来提高交互性和理解程度,其缺点包括可能分散注意力、引起用户的误解、产生"图表垃圾"等。时间序列数据是指具有时间属性的数据集,针对时间序列数据的可视化方法如下:线形图、堆积图、动画、地平线图、时间线。层次数据具有等级或层级关系。层次数据的可视化方法主要包括节点链接图和树图2种方式。其中树图(treemap)由一系列的嵌套环、块来展示层次数据。为了能展示更多的节点内容,一些基于"焦点+上下文"技术的交互方法被开发出来。包括"鱼眼"技术、几何变形、语义缩放、远离焦点的节点聚类技术等。网络数据具有网状结构。自动布局算法是网络数据可视化的核心,目前主要有以下3类:一是力导向布局(force-directed layout);二是分层布局(hierarchical layout);三是网格布局(grid layout)。当数据节点的连接很多时,容易产生边交叉现象,导致视觉混淆。解决边交叉现象的集束边(edge bundle)技术可以分为以下几类:力导向的集束边技术、层次集束边技术、基于几何的边聚类技术、多层凝聚集束边技术和基于网格的方法等。其他研究热点包括图形的视觉因素研究、自适应可视化研究、可视化效果的评估等。视觉因素对于可视化效果的影响,如位置、长度、面积、形状、色彩等影响已经引起很多研究者的注意。色彩是视觉因素的重要组成部分,研究主要集中在颜色选择的原则和交互系统中。这些原则基于数据类型、类的数量、认知约束等。自适应可视化可以提高信息可视化的适应性。研究成果分为以下几类:自适应可视化展示、自适应资源模型、自适应用户模型。自适应可视化展示是指根据用户的特征自动为用户提供多种展示类型,自动选择可视化内容及布局的形式,自动调整可视化的元素等。自适应资源模型反映了对硬件和软件的利用以提高可视化性能。自适应用户模型通过显示用户模型的内容并让用户能够编辑,从而让用户能够控制模型的内容。当前关于信息可视化评价的研究较少,少量研究也没有提出直接和通用的可视化的评估方式,需要对信息可视化评价的理论基础、方法和应用做深入的研究。可视化技术与应用还应该继续向以下4个方面努力:直观化、关联化、艺术化、交互化。信息可视化技术的发展方向是协同(collaboration)、分析过程(analytics)、计算(computational)和意会(sense-making)。未来研究方向可以包括以下几个内容。信息可视化和数据挖掘的紧密结合。为提高处理海量数据时的速度和效率和解决视觉混淆现象;必须运用数据挖掘的公式和算法,对数据分析的过程及结果进行可视化展现。协同可视化。协同可视化领域的研究方向可以包括可视化接口设计、基于Web的可视化协同平台开发、协同可视化工作的视图设计、协同可视化中的工作流管理及协同可视化技术的应用等。更多领域的应用技术开发。包括统计可视化:需要研究使用几何、动画、图像等工具对数据统计的过程和结果进行加工和处理的技术;新闻可视化:对新闻内容进行抓取、清洗和提取和可视化展示;社交网络可视化:可视化方式显示社交网络的数据,对社交网络中节点、关系及时空数据的集成展示。搜索日志可视化:针对在使用搜索引擎时产生的海量搜索日志,可视化的展现用户的搜索行为、关系和模式等。  相似文献   

15.
数据挖掘技术在电子商务中的应用   总被引:1,自引:0,他引:1  
对于企业而言,数据挖掘有助于发现业务发展的趋势,帮助企业做出正确的决策,使企业处于更有利的竞争位置。数据挖掘中应用的技术包括经典的统计、邻近、聚类,也包括最新发展起来的决策树、神经网络和关联规则等一些较新的方法。当实际开发一个数据挖掘系统时,究竟应该选择哪种数据挖掘技术,往往是一件很困难的事情。本文结合数据挖掘技术在电子商务中的应用,提出选择数据挖掘技术的两个重要依据,以便开发出有效、实用的数据挖掘系统。  相似文献   

16.
基于图标技术是数据挖掘可视化技术中的一种重要技术之一,本文在此技术的基础之上,给出了一种数据对象可视化表示的规范化方法,提出了基于图标技术的一种统计数据的可视化模型及表示方法,最后给出了利用此可视化方法的应用例.结果表明这种方法对于数据的可视化表示是简单而有效的.  相似文献   

17.
 为面向可拓建筑设计进行可拓数据挖掘, 以可拓建筑设计数据为对象, 探讨将其转化为高质量的结构数据的流程与方法。根据跨行业数据挖掘标准流程(CRISP-DM), 建立包括基元化表达、数据表设计、数据筛选、数据形式变换、变量标准化处理和变量维数约简6 个步骤的数据准备流程, 并根据建筑学专业特点, 结合可拓学、几何学、统计学理论, 设计各步骤的操作方法, 构建出完整的数据准备流程与方法。案例检验结果表明, 按照该流程及其操作方法, 可有效地将可拓建筑设计数据转化为统一格式、高信度、量化且可运算的结构数据。  相似文献   

18.
数据挖掘在人口普查信息系统中的应用   总被引:1,自引:1,他引:1  
科技的发展使得数据挖掘广泛地运用在了商业、政府等各个领域的数据分析中;笔者分析了数据挖掘技术的基本原理及其方法;透析了数据挖掘技术在人口普查信息分析中的应用及现实价值.  相似文献   

19.
论数据挖掘技术在信息分析中的应用   总被引:1,自引:1,他引:0  
从通用数据挖掘步骤入手,阐述了数据挖掘技术在各信息分析领域中的应用,结合实例探讨了Web数据的特点及实现Web数据挖掘的有效方法.  相似文献   

20.
讨论了统计学方法在数据挖掘中的应用与联系,包括贝叶斯分类法和用于连续值预测的线性回归统计技术建模,以及基于统计学的概念聚类方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号