首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
从数据库中发现知识的研究   总被引:1,自引:0,他引:1  
赛煜  姚红  李林 《山东科学》2004,17(4):57-59
数据库知识发现是90年代中期兴起的决策支持新技术,是人工智能、机器学习与数据库技术相结合的产物。要从数据量庞大的大型数据库中发现知识,就不得不考虑学习算法的效率。将粗集理论应用到数据库知识发现中,可以从数据中自动抽取与给定的学习任务相关的属性,能有效地发现简练、贴切的知识。本文探讨了这一应用的理论基础和实现算法。  相似文献   

2.
Rough集理论与KDD中属性约简算法   总被引:4,自引:0,他引:4  
针对数据库中知识发现(KDD)的信息处理问题,给出了信息系统中的Rough集理论基本概念的形式化描述,并且提出了一种KDD中属性约简算法(AR),实例表明该算法十分有效。  相似文献   

3.
为了有效地从凸序列中约简数据和发现知识,解决Rough集集中的凸序列问题,在深入研究凸序列和Rough集理论的基础上,提出了凸Rough集模型,定义了凸Rough集和凸Rough集糊集,给出了凸Rough集糊集的隶属函数和应用凸Rough集进行数据约简及规则发现的算法,最后分析了一个应用案例,验证了模型的可行性,表明应用凸Rough集模型可以更好地进行数据约减和规则发现。  相似文献   

4.
粗集在知识发现中的应用   总被引:4,自引:0,他引:4  
粗集作为一种数据分析理论,能有效地从不确定性的数据中发现知识,是目前在知识发现领域研究的热点之一。首先对粗集理论做了简单介绍,在此基础上论述了粗集作为一种数学工具在知识发现领域中的重要问题,并提出粗集的进一步可能发展方向。  相似文献   

5.
认为数据量的巨大和高维、用户交互与先验知识的利用等等是知识发现领域面临的问题和难点。粗糙集理论是一种具有模糊边界的集合理论,它作为研究知识发现的新型工具,能严格地处理不精确数据的分类问题,被广泛应用于不相容决策表中的规则提取过程中。针对粗糙集理论中属性约减和属性值约减这两个重要问题进行了研究,并介绍了数据集中挖分类规则的基本原理,同时利用RS理论中核和核值的概念,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系并简化决策系统的数据挖掘算法,并应用一简单的例子说明如何在数据库中发现分类规则,实验结果表明此算法可以大大提高系统潜在知识的清晰度。  相似文献   

6.
数据库设计和管理工具中,从已知数据库发现函数依赖是一个重要的技术。本文基于自由集的概念,讨论了最小函数依赖(FDs)的一个新特性和相关重要性质,并给出一个有效的最小函数依赖挖掘算法。  相似文献   

7.
基于粗糙集的数据挖掘   总被引:3,自引:0,他引:3  
粗糙集理论是一种研究不完整、不确定知识处理的数学工具,近几年来在机器学习、知识发现、算法研究、工程应用、决策支持系统以及模式识别等应用中取得了较好的成果,阐述了粗糙细论的基本思想,介绍了人工智能中数据挖掘的一般过程及其方法。  相似文献   

8.
为更有效更迅速地获得大量信息中所包含的潜在知识和规律,有关数据挖掘和数据库知识发现的研究变得更为广泛和深入.结合粗糙集理论的优势和层次分析模型的特点并将两者有机地结合起来,通过在非核属性中引入重要性概念并利用简单相异矩阵,提出了基于粗糙集理论和层次分析的数据约简算法,同时证明了该算法的有效性和完备性.最后,应用该算法解决了医疗决策系统中一个数据约简问题,实现了知识和规律的挖掘,提高了数据约简的合理性.  相似文献   

9.
介绍一种新的粗集编码模糊神经分类器。基于粗集理论的概念,讨论了知识编码、属性简化、分类系统简化的方法;并利用模糊隶属度函数将输入精确信息映射为模糊变量信息,解决分类中病态定义的数据问题和提高系统非线性映射的分类能力;提出了结合系统参数的重要性因子的网络的模糊推理方法和粗模糊神经分类器的网络结构以及有导师的最小平方误差学习训练算法。实现的粗集编码模糊神经分类器具有网络结构空间维数低、学习算法简单、网络训练时间短、非线性特性丰富等优点。  相似文献   

10.
Apriori算法是经典的关联规则挖掘算法,主要缺点是可能产生大量的候选集和需要多次扫描数据库.从幂集运算的角度提出了一种新的关联规则挖掘算法P_DM算法,实现了只需要扫描一次数据库就产生所有频繁集.实验证明这种算法在中小规模数据挖掘上效率优于Apriori算法.  相似文献   

11.
知识发现与数据挖掘是人工智能、机器学习与数据库技术相结合的产物。随着科学数据大量积累和各种数据库的普遍使用,人们又逐步认识到海量数据的利用十分困难、效率低下,而且从中难以获得有价值的指导性意见。另一方面,更多带规律性的信息和知识又往往被大量原始数据淹没。在这种情况下,数据挖掘技术就应运而生,出现在众多学科领域,成为一种强大的化学信息技术。  相似文献   

12.
数据挖掘是一个非常有用的工具,通过它能够从大型数据库中发现知识。目前,众多研究者将其主要研究工作放在了数据挖掘的模型与方法等工程技术问题上,对于数据挖掘的一些基础理论问题却研究不足。通过对数据挖掘基本理论的研究,提出了面向领域的数据驱动自主式知识获取模型。并通过一系列数据驱动自主式知识获取算法验证了该模型的有效性。  相似文献   

13.
数据挖掘是一个非常有用的工具,通过它能够从大型数据库中发现知识.目前,众多研究者将其主要研究工作放在了数据挖掘的模型与方法等工程技术问题上,对于数据挖掘的一些基础理论问题却研究不足.通过对数据挖掘基本理论的研究,提出了面向领域的数据驱动自主式知识获取模型.并通过一系列数据驱动自主式知识获取算法验证了该模型的有效性.  相似文献   

14.
结合人工神经网络中的自适应共振理论(ART)及数据挖掘(Data Mining)技术来建构一个可自动聚类族群特征且能挖掘出关联特质的自动化在线推荐系统。探讨如何有效地运用数据挖掘技术从大量的数据库中挖掘出完整知识,以推荐适当的信息给使用者,帮助他们在浩大的信息流中找到真正需要、有用的文件或信息。整合ART及数据挖掘技术,并针对推荐系统的特性提出一种改进的ART算法(MART算法)。实例验证了算法的有效性。  相似文献   

15.
一个适用于地理信息系统的数据挖掘工具——GISMiner   总被引:6,自引:1,他引:6  
论文将常用于关系型、事务型数据库的面向属性归纳的方法和关联规则挖掘方法扩展至空间数据库,开发了适用于地理信息系统(GIS)的空间数据挖掘工具-GISMiner,并将其应用于从农田GIS中挖掘农田使用情况的空间特征规则,以及从农产品市场GIS中挖掘农产品价格与铁路、国道和河流间的空间关联规则实验。结果表明,GISMiner是一个实用的、能适应于GIS且能挖掘多种知识类型的数据挖掘工具。  相似文献   

16.
先进的应用持续产生非常大量有价值的数据,但是没有足够的技术来充分地抽取数据中潜在的知识.网格能为知识发现应用提供有效的计算支持.该文介绍了一个新颖的面向服务分布式高性能网格数据挖掘体系结构和设计原理.设计和实现了基于先进的Globus Toolkit 4和OGSA-DAI网格服务的分布式数据挖掘体系结构,并进一步用网格数据挖掘原型验证了该体系结构.  相似文献   

17.
大型的数据库和数据仓库中的数据往往是有噪声和不一致的,应用经典的粗糙集理论对其进行数据挖掘处理时,效果不够理想.引入信息颗粒的概念,给出了属性子集引导的信息颗粒的构造方法及基于信息颗粒的知识描述,并应用粗糙集的扩展模型讨论知识的粗糙度问题,提出了基于粗糙信息颗粒的属性约简算法,该算法在给定最小置信度阈值的情况下,可实现对不一致数据集的简洁知识提取.图1,表2,参8.  相似文献   

18.
数据挖掘是一门新兴技术。在数据提取中如何去除冗余数据是数据挖掘研究的重点之一。在研究粗糙集理论的基础上,将属性约简法应用到数据挖掘的知识约简中,可有效地删除冗余数据,并能取得较好的约简结果。  相似文献   

19.
提出了通过数据挖掘技术实现基于有限元仿真结果的知识发现.分析了数据挖掘的一般步骤,建立了基于有限元仿真结果的知识发现系统,论述了知识发现系统的各个模块及实现该系统的关键技术;对粗糙集和主成分分析法作了简单的介绍,并举实例对粗糙集方法作了说明.通过数据挖掘技术将计算实例提炼出来,作为一种知识源参与到设计优化过程中去,将CAE从设计验证层次提升到设计驱动层次.  相似文献   

20.
基于属性的粗糙集在数据挖掘中的应用   总被引:3,自引:0,他引:3  
研究怎样能够有效地实现基于属性的粗糙集理论的数据挖掘技术.详细讨论了粗糙集理论;为了从基于属性的数据库中发现新的规则,研究了一种适合数据挖掘的面向对象的商业市场研究软件体系的应用.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号