首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
从信息系统发展的角度综述了知识发现及知识发现过程中数据的方法和应用。  相似文献   

2.
数据采掘是数据库中知识发现的核心 ,概念树方法是数据采掘较常用的方法之一 ,该文详细描述了该方法在模糊性问题中的应用  相似文献   

3.
如何从已有的大量数据中找出对决策有用的信息支持决策已成当务之急,数据采掘技术可帮助我们完成这项工作,本文简要介绍数据采掘的概念,采掘方法类型和关联规则采掘算法,结合实际给出了一个在教学管理中的应用探讨,所挖掘出的深层次知识,对帮助我们搞好教学管理有重要的指导作用。  相似文献   

4.
数据仓库和数据采掘研究综述   总被引:6,自引:0,他引:6  
数据丰富而知识贫乏的状况导致了数据仓库和和数据采掘技术的出现,引起了许多不同领域的人们的极大关注。对数据仓库和数据采掘的基本概念、关键技术以及主要研究内容了一个综合样性的介绍,并讨论了数据仓库和数据采掘相结合的特点和发展潜力。  相似文献   

5.
贝叶斯网络的建造及其在数据采掘中的应用   总被引:40,自引:0,他引:40  
贝叶斯 (Bayesian)网络近年成为数据采掘引人注目的研究方向。通过剖析 Bayesian网络的结构和建造步骤 ,着重讨论用 Bayesian方法从先验信息和样本数据进行学习以确定网络的结构和概率分布的基本方法 ,分析 Bayesian网络学习的特点 ,探讨 Bayesian网络的适用性。与数据采掘的其它方法相比 ,Bayesian网络的优点是可以综合先验信息和样本信息 ,这在样本难得时特别有用 ;可以发现数据之间的因果关系 ,适合于处理不完整数据集 ,这是其它模型难以做到的。其缺点是计算开销较大 ;确定合理的先验密度比较困难 ;如何判定实际问题是否满足所要求的假设 ,没有现成的规则  相似文献   

6.
改进的关联规则采掘算法及其实现   总被引:7,自引:0,他引:7  
在现有的关联规则采掘算法的基础上,进一步分析了经典算法的内涵,提出了生成大项目集优化时减少对交易数据库扫描次数的改进算法,并给出改进后的算法描述。在DBMS平台上用数据查询语言实现关联规则的采掘。结果表明,改进的算法对关联规则的采掘十分有效。  相似文献   

7.
数据采掘是数据库中知识发现的核心,详细描述了数据采掘中概念树方法在模糊性问题中的应用.  相似文献   

8.
介绍了在数据库知识发现(KDD)中将连续属性离散化的一些方法,并提出使用值差分度量离散化的算法.值差分度量算法原本是用于计算离散属性值间的距离,但实际上将这种方法反过来用于连续属性的离散化也可以有相当好的效果.将其与传统的使用统计量χ2的离散化算法作了比较.  相似文献   

9.
随着人类产生数据量的增加,数据可视化需要处理的数据规模、类型及需求都发生了显著变化。在大数据时代,数据可视化面临诸多新的挑战。从大数据本身的特点及其应用需求出发,结合数据可视化的研究现状,介绍了适用于大数据的数据可视化技术;分析在大数据条件下数据可视化所要解决的8个关键问题;讨论了针对大数据可视化应用需求自主研发的交互式可视化设计平台AutoVis及其应用。  相似文献   

10.
基于粗糙集理论的分类规则发现   总被引:25,自引:0,他引:25  
研究了利用粗糙集理论中核的概念,求取信息系统的最小简化策略,给出了从数据库中发现分类规则的方法。  相似文献   

11.
面向通用数据资源,研究聚类数据可视化方法与技术,旨在探索有效的数据处理方法,满足信息领域对高维数据处理的要求。通过对高维数据进行降维处理和可视化映射实现,建立K均值算法的聚类数据挖掘可视化系统模型,实现中间聚簇结果、聚类中心、收敛准则函数值三类要素的可视化。利用加利福利亚大学欧文分校(UCI)数据库中的Iris数据集、Wine数据集、Seeds数据集对可视化系统模型方法进行测试。结果表明,该模型实现了对数据集的有效聚类,能够将中间聚类、聚类中心、收敛准则函数值进行实时有效的可视化表达,达到了预期效果。  相似文献   

12.
生物序列数据是生物信息数据中重要的一部分,研究生物序列解读其隐含的生物学意义是生物信息学研究的热点和难点。数据挖掘是当前分析大规模数据的有效工具之一,已广泛应用于分析生物序列数据,并取得了许多研究成果。文章综述了生物序列数据挖掘的关键技术,包括序列比对算法、DNA序列模式挖掘、关联、分类、聚类分析、RNA二级结构预测、蛋白质序列分类和聚类分析,最后展望未来研究方向。  相似文献   

13.
 介绍了数据挖掘的概念及任务,阐述了数据挖掘技术中的常用方法和Apriori算法,并对数据挖掘的一些算法作了简单分析.  相似文献   

14.
数据挖掘技术在网络入侵检测中的应用   总被引:4,自引:0,他引:4  
论述了入侵检测系统的基本概念,针对目前入侵检测系统中存在的问题,提出了一个基于数据挖掘技术的自适应入侵检测系统模型。介绍了该系统模型的基本思想,阐述其结构及主要功能,着重分析了该系统的数据挖掘和检测过程。利用数据挖掘技术自动地从大量数据中提取重要的特征和新的模式,生成有意叉的规则并建立检测模型,实现对分布式拒绝服务攻击DDoS(Distrbute Denial of Service)入侵的检测方法。  相似文献   

15.
数据挖掘技术在管理与决策中的应用   总被引:2,自引:0,他引:2  
利用数据挖掘技术和模糊关系数据库能够分析和处理大量复杂数据关系进而发现有知识和模式的优点,将两者结合应用于企业战略管理与决策过程中,在分析企业的内外部运行环境时,通过建立模糊近似关系,对相关模糊区域进行最优划分,从而识别企业的运行模式,确定出所涉及的每一企业在竞争市场中的相对地位,为企业进一步制定和实施发展战略,最终实现科学的战略决策,提供了有力的依据。  相似文献   

16.
Recent advances in computing, communications, digital storage technologies, and highthroughput dataacquisition technologies, make it possible to gather and store incredible volumes of data. It creates unprecedented opportunities for largescale knowledge discovery from database. Data mining is an emerging area of computational intelligence that offers new theories, techniques, and tools for processing large volumes of data, such as data analysis, decision making, etc. There are many researchers working on designing efficient data mining techniques, methods, and algorithms. Unfortunately, most data mining researchers pay much attention to technique problems for developing data mining models and methods, while little to basic issues of data mining. In this paper, we will propose a new understanding for data mining, that is, domainoriented datadriven data mining (3DM) model. Some datadriven data mining algorithms developed in our Lab are also presented to show its validity.  相似文献   

17.
数据挖掘方法的评述   总被引:2,自引:0,他引:2  
决策离不开知识,从数据库中采掘知识,是解决从大信息量中获取有用知识的有效途径.但是在实际数据库中,数据的复杂性(如信息量大、噪声等)对数据挖掘方法提出了比机器学习更高的要求,这方面的研究正受到越来越多的关注.本文就当前数据挖掘的几种主要方法,即神经网络、决策树、粗集和云模型等方法的研究现状进行了评述,指出其存在的问题.从总体上看,这些方法都有局限性,但它们的有机组合具有互补性,多方法融合将成为数据挖掘的发展趋势,最后指出数据挖掘方法面临的挑战.  相似文献   

18.
为了研究p53基因与其下游/靶基因的关联性,以了解p53基因表达调控网络,采用文本数据挖取方法,利用自编的Perl 5.10程序,对PubMed文献数据库中p53基因相关文献及人类基因本体数据库进行数据挖掘,并利用连锁聚类法构建p53基因表达调控网络图.结果发现,目标基因的频率分布同文本中所有基因本体的频率分布存在一定的关联性,低频基因的文本挖掘比例明显低于高频基因的文本挖掘比例.从而说明,p53基因表达调控网络中各基因的分布情况与基因频率有较大关系,而文本数据量对文本数据挖掘的准确率也有重要影响.  相似文献   

19.
大型的数据库和数据仓库中的数据往往是有噪声和不一致的,应用经典的粗糙集理论对其进行数据挖掘处理时,效果不够理想.引入信息颗粒的概念,给出了属性子集引导的信息颗粒的构造方法及基于信息颗粒的知识描述,并应用粗糙集的扩展模型讨论知识的粗糙度问题,提出了基于粗糙信息颗粒的属性约简算法,该算法在给定最小置信度阈值的情况下,可实现对不一致数据集的简洁知识提取.图1,表2,参8.  相似文献   

20.
基于神经网络的数据挖掘方法评述   总被引:1,自引:0,他引:1  
简要叙述了数据挖掘的概念及几种主要的基于神经网络的数据挖掘方法,并对这些方法的研究现状进行了评述,指出其存在的问题.展望神经网络在数据挖掘中的发展潜力.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号