首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 203 毫秒
1.
针对农业资源属性数据挖掘提出了预处理方法,并在此基础上探讨了对应数据挖掘的3个层次(即由原始数据生成新的数据,由数据产生模型,由数据归纳出知识),为农业资源数据处理提供了一种解决途径。  相似文献   

2.
数据挖掘是一个非常有用的工具,通过它能够从大型数据库中发现知识。目前,众多研究者将其主要研究工作放在了数据挖掘的模型与方法等工程技术问题上,对于数据挖掘的一些基础理论问题却研究不足。通过对数据挖掘基本理论的研究,提出了面向领域的数据驱动自主式知识获取模型。并通过一系列数据驱动自主式知识获取算法验证了该模型的有效性。  相似文献   

3.
数据挖掘是一个非常有用的工具,通过它能够从大型数据库中发现知识.目前,众多研究者将其主要研究工作放在了数据挖掘的模型与方法等工程技术问题上,对于数据挖掘的一些基础理论问题却研究不足.通过对数据挖掘基本理论的研究,提出了面向领域的数据驱动自主式知识获取模型.并通过一系列数据驱动自主式知识获取算法验证了该模型的有效性.  相似文献   

4.
一个适用于地理信息系统的数据挖掘工具——GISMiner   总被引:6,自引:1,他引:6  
论文将常用于关系型、事务型数据库的面向属性归纳的方法和关联规则挖掘方法扩展至空间数据库,开发了适用于地理信息系统(GIS)的空间数据挖掘工具-GISMiner,并将其应用于从农田GIS中挖掘农田使用情况的空间特征规则,以及从农产品市场GIS中挖掘农产品价格与铁路、国道和河流间的空间关联规则实验。结果表明,GISMiner是一个实用的、能适应于GIS且能挖掘多种知识类型的数据挖掘工具。  相似文献   

5.
针对飞机装配质量数据体系化不高,数据挖掘利用率低下等问题,探索出一种面向飞机装配质量数据深度分析方法。通过建立由质量数据关系模型和质量数据仓库模型共同组成质量数据模型体系,设计出一种基于数据模型体系的飞机装配质量数据挖掘循环机制。采用聚类算法选择质量问题关键特征点,同时运用Apriori算法寻找各关键因素的关联关系,最终借助Weka软件实现装配质量数据深度分析。以某型飞机前机身部件装配质量数据验证了该方法的可行性和有效性。  相似文献   

6.
在浩瀚的数据资源中发现并提取有价值的知识是目前数据库、人工智能等学科研究中的共同热点问题.面向属性的归纳是一种广泛使用的特征规则的发掘算法,本文对特征规则挖掘的面向属性归纳方法进行改进,提出了“分类信息库”的概念,给出了基于这种概念的新算法.利用这种算法可以发现很多原方法发现不了的新知识,使特征规则的发现有了更大的实用价值.实例分析表明,该算法能够准确地发现特征规则。  相似文献   

7.
大数据中的知识发现是大数据应用中的核心热点.本文从高度抽象认知事物视角出发,以表征事物普遍性为特征的概念驱动与表征事物特异性为特征的数据驱动两种方法学为哲学原理,提出了基于属性偏序结构图和对象偏序结构图的知识发现方法.分别从群结构、子群结构、支路、节点等角度对数据特征之间的结构关系进行讨论分析.属性偏序结构图将数据中具有某些共同特征的对象聚类到一起,是数据共性的表达;对象偏序结构图中,通过数据的独有属性可以快速有效的将特异性对象区分于其他对象.最后,以中医药方剂配伍研究问题为例,对张锡纯治疗中风的32个处方进行数据挖掘和知识发现,证明了该方法的有效性和实用性,为大数据知识发现研究提供了新的思路和方法.  相似文献   

8.
在浩瀚的数据资源中发现并提取有价值的知识是目前数据库、人工智能等学科研究中的共同热点问题.面向属性的归纳是一种广泛使用的特征规则的发掘算法.本文对特征规则挖掘的面向属性归纳方法进行改进.提出了"分类信息库"的概念.给出了基于这种概念的新算法.利用这种算法可以发现很多原方法发现不了的新知识,使特征规则的发现有了更大的实用价值.实例分析表明,该算法能够准确地发现特征规则.  相似文献   

9.
一种构造数据仓库的扩展时间轮转模型   总被引:1,自引:0,他引:1  
阐述了抽象属性、广义抽象属性、时间标注、时域和抽象属性的拓展等与扩展时间轮转模型相关的基本概念,描述了扩展时间轮转模型的原理、分类和相关因素,介绍了面向客观主题及面向时间特征的扩展时间轮转模型的构造策略·结合具体实例,从存储效率、数据抽取效率、构造便利性和实用性等多方面分析了时间轮转模型和传统数据仓库模型的优缺点·实践表明,按时间轮转模型构造的数据仓库,对联机分析处理和数据挖掘等技术都有较好的支持·  相似文献   

10.
随着大量的XML数据的出现,给数据挖掘领域提出了新的挑战。传统数据挖掘算法是面向关系数据库和数据仓库的,不能直接用于XML文档的数据挖掘。本文从模糊集的基本理论入手,通过定义模糊概念软化属性论域的划分边界,提出了一种面向XML数据的模糊关联规则挖掘方法,并且使用Java语言实现,实验结果证明本文算法是正确的。  相似文献   

11.
为了解决数据挖掘过程中挖掘的知识粒度过粗或过细问题,并利用概念格的偏序特性,提出了一种基于量化概念格的属性归纳算法.首先对概念格的外延进行量化,得到量化概念格,再根据概念格的哈斯图,采用概念的爬升进行相应的泛化,从而获得基于量化概念格的多层、多属性归纳.与面向属性归纳(AOI)算法相比较,结果表明所提算法不仅能实现AOI的单一属性归纳,还能进行多层、多属性的归纳,其属性泛化的路径不是惟一的,并且很容易在量化概念格的哈斯图中寻找合适的泛化路径和阈值,以此得到用户要求的、合理的属性归纳结果.  相似文献   

12.
任何高效的客户关系管理都是以扎实的客户分类为基础,然而电子商务中所搜集到的客户信息往往具有海量、高维度和不完备等特点,传统的客户分类方法很难适合B2C客户数据的分类.研究表明,数据挖掘的实质是知识在不同形态下的转换过程,面向领域的数据驱动的数据挖掘理论(3DM)能将领域知识、先验知识和数据本身的特点有机结合.以电子商务B2C客户数据为例,设计了基于3DM的客户分类算法,通过实例表明,该算法能较好地解决B2C客户数据的分类问题.  相似文献   

13.
偏序结构图因其良好的知识可视化特性已在知识发现、数据挖掘等领域得以广泛应用.但在对大数据所形成的超大形式背景进行研究和分析时,偏序结构树形图存在的一些不足,使大数据可视化效果欠佳,不利于对大数据进行数据挖掘和知识发现.本文对偏序结构树形图进行改进,提出了可用于大数据分析的偏序结构环形图.对实例形式背景绘制出偏序结构环形图,并与其偏序结构树形图比较.实验结果表明,该方法清晰、直观,可视化效果较好,能更有效地呈现出大形式背景中的重要信息,可以应用在大数据的数据挖掘和知识发现中.  相似文献   

14.
一种关系数据库中基于云模型关联规则的提取   总被引:2,自引:1,他引:2  
为了发现有效的关联规则,属性在比较高的水平被范化,允许相邻属性值或者语言项的重量.这种软划分可以映射人类的想法,同时使发现的知识鲁棒.利用云模型的理论与方法求解数量关联问题,给出了一种云关联规则的定义,并提出了基于云模型理论支持度和置信度的计算方法,最后提出了一种提取算法Cloud model A.这种方法较好地软化了数量属性论域的划分边界,从而使得挖掘出的云关联规则更容易被人理解。  相似文献   

15.
数据挖掘综述   总被引:59,自引:1,他引:59  
从人工智能、统计分析和数据库技术3个方面对数据挖掘技术进行了总结;从模式识别的角度讨论了数据挖掘技术的主要任务,包括分类、聚类、回归、关联、序列和偏差6种模式的识别.详细介绍了数据挖掘技术的常用方法,包括模糊理论、粗糙集理论、云理论、证据理论、人工神经网络、遗传算法以及归纳学习.列举了当前数据挖掘技术的实际应用场合,并指出其今后的发展趋势以及急需关注的问题.  相似文献   

16.
区间集是解决部分已知概念、近似不可定义或复杂概念的研究工具。概念格是机器学习、数据挖掘、知识发现和信息检索等领域的一种很有效的数据分析工具。区间集概念格是这两种方法的结合,是对于部分已知概念或不可定义概念信息系统进行机器学习、数据挖掘、知识发现和信息检索的一种有效的数据分析工具。区间集属性约简是揭示区间集概念格本质特征的一种方法。本文揭示了区间集属性约简的组成与结构:两个区间集相对必要属性不能在同一个区间集属性约简中出现;区间集约简与任何一个区间集相对必要属性等价类的交都不空;核心属性和每个区间集相对必要属性等价类中取一个属性组成的集合一定是区间集属性约简。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号