首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 218 毫秒
1.
一种基于层次聚类的流数据挖掘方法   总被引:1,自引:0,他引:1  
流数据的特点在于数据流快速、有序地到达,并且数据海量,许多应用领域中生成的数据都可以归结为此类型.数据挖掘技术可以从海量的数据中发现有意义的知识模型,传统的数据挖掘算法通常是针对静态数据集,对流数据却无法有效地处理.文章试图从层次聚类角度处理流数据,并探讨了一种基于最小代价函数的层次聚类算法.  相似文献   

2.
在当前的数字时代,海量的信息数据已经远远超出情报研究人员的分析和处理能力,而传统情报研究的技术和工具已无法满足情报研究人员的需求.由于数据挖掘技术在处理海量数据时显示了其独特的优点,可与现代情报研究有机结合.本文首先介绍了数据挖掘技术的基本概念和常用方法,并对其在情报研究中的应用进行初步探讨.  相似文献   

3.
数据挖掘在各行业发挥着越来越重要的作用,随着数据挖掘中数据量的高速增长以及大规模计算在数据挖掘中的应用,挖掘算法处理海量数据的能力问题日益突出。研究并行算法是解决这一问题的有效途径,该文对常见的数据挖掘关联规则及聚类并行算法进行了研究探讨。  相似文献   

4.
数据挖掘技术及其应用研究   总被引:16,自引:0,他引:16  
数据库—数据仓库技术和网络技术的迅猛发展 ,使我们积累了越来越多的数据 ,如何对这种海量数据进行深入分析和利用 ,并从中发现有用的知识 ,已成为信息化社会所面临的重要问题 .探讨近年发展起来的海量数据处理技术—数据挖掘的概念、任务、方法、过程 ,以及数据挖掘在有关行业中的应用 ,说明了在高校相关专业中开设数据挖掘课程的必要性  相似文献   

5.
数据挖掘技术是一项能够从海量数据中发现潜在的、有价值的知识热点技术。面临海量非空间数据和空间数据的水利工程管理,利用数据挖掘技术能够提炼出具有较大价值的知识,使水利工程管理的更加科学化。当前,水利工程得到快速发展,而大量的空间数据和非空间数据存在于水利工程管理中,需要运用相应的数据处理技术进行有效处理。该文主要对数据挖掘技术进行综合分析,通过探讨数据挖掘技术的实施方法,得出如何让水利工程管理与数据挖掘技术更好的结合。  相似文献   

6.
多策略数据挖掘系统的分析与设计   总被引:1,自引:1,他引:0  
为了满足数据规模的膨胀和分析需求的增长,在对数据挖掘系统的发展史进行回顾的基础上,分析了国内外典型数据挖掘系统的特点,设计了一个多策略的数据挖掘系统。并针对数据挖掘面临的大规模海量数据的处理问题,为系统引入和设计了算法插件思想、缓冲区处理技术、基于XML(Extensib le M arkup Lan-guage)语言的配置文件和相应的并行处理技术。最后讨论了系统今后开发过程中需要注意算法更新及评估的问题。  相似文献   

7.
章沛 《太原科技》2005,(2):90-92
目前海量的数据存储已远超过了人们的理解能力,尤其是现代医学数据量越来越大,而传统的统计技术及数据管理工具已经不能满足需求。知识发现及数据挖掘工具在处理海量数据库时显示了它们的长处。介绍了数据挖掘的概念和方法及其在青少年健康心理状况研究中的应用。  相似文献   

8.
李娜 《科技信息》2008,(35):73-73
随着海量数据搜集技术提高、数据挖掘算法的不断完善、多处理器计算机技术的不断发展,成为支持数据挖掘技术发展的基础,数据挖掘使数据库技术进入了一个更高级的阶段,它不仅能对历史数据进行查询和遍历,并且可以找出历史数据之间的游在联系,从而促进信息的传递。  相似文献   

9.
针对传统决策树SPRINT(Scalable Parallelizable Induction of Decision Trees)算法不能处理海量地学数据挖掘的问题, 设计实现了基于G4ICCS(Geology Geography Geochemistry Geophysics Information Cloud Computing System)的决策树并行分类算法PSPRINT。该算法使用哈希表存储连续属性分割点两侧的数据记录, 为并行节点的分割提供依据, 在MapReduce架构下解决了海量地学数据挖掘问题。实验结果表明, 在模拟的云计算环境下, 决策树并行算法可以处理海量地学数据分类问题, 并获得较好的稳定性和较高的处理速度。  相似文献   

10.
数据挖掘中分类算法的可扩展性研究   总被引:1,自引:0,他引:1  
分类是数据挖掘中最重要的技术之一,而且应用领域非常广泛,但面对新出现的海量数据,目前已有的许多分类算法不具备良好的伸缩性,不能从巨大的数据集中快速而准确地发现有用的知识.针对这一问题,本文对分类算法的可扩展性方法进行了深入的研究,并对各种方法进行了分析和对比,从而便于研究和开发者对已有的算法进行改进和扩展,以适应数据挖掘技术的不断发展.  相似文献   

11.
数据挖掘是一种新兴的信息处理技术,模糊聚类是数据挖掘领域中的一个重要研究课题。论文从数据挖掘的概念出发,研究分析了模糊聚类的主要算法,并从多个方面对这些算法性能进行比较,同时还对模糊聚类分析在数据挖掘中的应用进行了阐述,最后对模糊聚类的研究领域进行了总结和展望。  相似文献   

12.
可视化数据挖掘技术   总被引:1,自引:0,他引:1  
通过对可视化数据挖掘进行分类和总结,提出将可视化数据类型和可视化与数据挖掘结合的思想。由于可视化数据挖掘的优势是用户能直接参与数据挖掘过程,通过对挖掘过程中各个阶段反馈的信息可视化结果的分析,用户可以将领域知识和数据挖掘算法有效地结合在一起,完成用户和算法的交互。因此,可视化数据挖掘技术将成为今后数据挖掘领域中研究的热点。  相似文献   

13.
在对集装箱多式联运各环节进行深入分析基础上,基于雪花型架构构建了多式联运多维数据库,在此基础上对其进行多维数据分析,进而对多维数据库中的数据进行了数据挖掘.前端展示证明了该技术运用子集装箱多式联运信息处理的可行性和有效性,可为集装箱多式联运提供决策支持.  相似文献   

14.
随着市场竞争的加剧和信息社会需求的发展,从大量数据中提取(检索、查询等)用于决策和分析的信息就显得越来越重要.通过会计数据仓库设计、会计数据抽取、会计数据维护、会计决策需求设计、挖掘算法设计,以及挖掘操作、结果表达和解释等,可以从海量的财务数据中发掘有用的、重要信息组合,为企业发展、领导决策等提供科学的技术支持.  相似文献   

15.
在地质勘察的土工试验中产生大量的数据,迫切需要挖掘隐藏在这些数据间的大量有趣信息。而数据预处理技术的好坏直接影响数据挖掘的结果。现介绍一种在挖掘关联规则前的数据预处理技术,给出了相应算法,并通过实例说明了算法的执行过程。  相似文献   

16.
目前市场上有很多股票交易软件,这些软件会根据股票交易的实际情况定期产生股票交易信息数据,并将这些信息数据写入二进制格式的文件中,如DAY文件等.由于这些文件不是文本文件,无法直接使用常规的文件读写进行数据的抽取,而必须设计一种数据抽取算法完成相应操作.对DAY文件进行了分析和研究,在此基础上设计了一种数据抽取算法,并利用JAVA语言实现了数据抽取算法程序,利用该程序完成了从DAY文件中抽取数据并写入数据库的实验.实验结果表明,该程序能够正确地从DAY文件中抽取数据,为后期的股票信息处理和数据挖掘提供了重要的基础.  相似文献   

17.
为确保大数据云存储下海量数据传输的完整度,提出了一种基于属性特征匹配和关联规则的海量数据传 输完整度控制方法。构建海量数据的属性特征高维重组模型,得到关键信息的特征分布状况,据此设计海量数 据的关键信息存储分布结构模型,采用关联规则方法进行海量数据的关键信息特征挖掘提取,利用关键信息进 行海量数据的特征分析和数据聚类处理,采用属性特征匹配方法设计海量数据关键信息存储节点后,利用模糊 减法聚类对关键信息存储节点进行聚类处理,在海量数据传输中,以数据关键信息存储节点传输的完整度实现 海量数据的传输完整度控制。仿真结果表明,采用该方法进行海量数据传输完整度控制,能提高云存储下的空 间利用效率,数据传输完整度高。  相似文献   

18.
数据挖掘是指从数据库中抽取隐含的、具有潜在使用价值信息的过程,是一种新型的数据分析技术.研究数据挖掘中的决策树算法以及决策树算法在具体的客户关系管理系统中的研究与分析,对数据挖掘中的决策树技术做了详细的描述.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号