首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
关联规则挖掘是数据挖掘的主要技术之一,现有的关联规则挖掘算法均基于支持度-置信度框架,当用户调整阈值时存在多次遍历数据库和重复计算问题。该文针对支持度阈值变化时的关联规则维护问题,提出了关联规则交互挖掘算法HIUA,该算法改进了原始IUA算法的剪枝过程,并通过Hash结构提高算法运行效率。在UCI数据集及企业实际财务数据集中的实验结果表明:在支持度阈值发生变化的过程中HIUA算法进一步利用已有挖掘结果,有效提高了关联规则挖掘的效率。  相似文献   

2.
带有时态约束的多层次关联规则的挖掘   总被引:3,自引:0,他引:3  
为了适应现实世界数据中数据具有多层次性和时态性的客观情况,在以往关联规则挖掘算法的基础上,提出上具有时态约束的多层次关联规则的挖掘算法,该算法在核心思想是利用统计分析方法,根据用户给定的最小支持度和最小可信度,确定出用户感兴趣的关联规则,实例分析结果表明,该算法与单层次的无时效性的数据挖掘算法相比更有应用价值。  相似文献   

3.
认为传统的关联规则挖掘模型主要是针对结构化数据 ,其可信度和支持度不能随环境的变化自适应调节 ,即缺乏自适应性 ,而现实中还存在大量非结构化的数据 .针对传统发现模型的不足提出了一个基于事例的自适应关联规则发现模型 ,它不仅可以处理对非结构化数据的数据挖掘 ,而且还可以随着环境的变化自适应调节支持度和可信度 .  相似文献   

4.
多最小支持度下的关联规则及其挖掘方法研究   总被引:4,自引:0,他引:4  
数据挖掘指的是从大量的数据中提取隐含的、事先未知的、并且潜在有用的知识技术,是目前国际上数据库和信息决策领域最前沿的研究方向之一。关联规则是当前数据挖掘研究的主要领域之一,获取具有更高价值的规则是该领域的一个研究重点。针对目前大多数挖掘算法只能发现单一支持度下的关联规则问题,文中提出了一种基于多支持度的挖掘策略及在原有AprioriTid算法基础上的改进算法。  相似文献   

5.
基于SQL的Apriori改进算法   总被引:1,自引:0,他引:1  
Apfiofi算法是一种最有影响的挖掘关联规则的算法,由于其算法仅用支持度、可信度来衡量关联规则,容易生成一些错误规则,所以,引入了提升度这一概念,提出一种基于SQL的Apfiofi改进算法。  相似文献   

6.
关联规则是数据挖掘中的重要研究内容之一,本文针对关联规则的维护问题,在事务数据库不变前提条件下对最小支持度和最小可信度进行改变,设计实现了一个增量式更新的改进算法AIUA。  相似文献   

7.
针对使用传统关联规则算法挖掘大数据集时,挖掘过程中效率不高,挖掘出大量冗余规则的问题,提出了基于关联规则和相似度的数据挖掘算法(U-APR):首先,一次性读入数据并构建矩阵,并利用关联规则支持度度量的特性来增加判断属性,以加快结束迭代过程,从而改进了Apriori算法频繁扫描数据库问题;然后,使用相似度算法去除冗余的关联规则;最后,结合置信度、支持度和用户目标匹配度对挖掘结果进行排序输出,从而得到用户感兴趣的关联规则. 同时,应用该算法与目前常用的2种关联规则算法对广东某高校学生财务数据进行数据挖掘. 实验结果表明:与2种常用的关联规则算法相比,U-APR算法缩短了运算时间和提高了存储空间利用率,对用户分析挖掘结果有较好的优化效果.  相似文献   

8.
王娟 《科技信息》2011,(33):56-56,45
关联规则是数据挖掘的重要手段,它基于支持度、置信度等对规则进行筛选,生成有用的规则。关联规则反映了大量数据中项集之间的相互依存性和关联性。Apriori算法和FP-Growth算法是关联规则挖掘中的两个典型算法。本文阐述了这两种算法的基本思想、数据挖掘步骤,并讨论了它们的优缺点及差异。  相似文献   

9.
一种基于关联规则的属性值约简算法   总被引:3,自引:1,他引:3  
数据约简是数据挖掘中的一个重要领域.将属性值约简和关联规则挖掘相结合.给出了支持度、置信度、属性值重要性的定义.在此基础上.提出一种新的用来进行数据挖掘的算法——基于关联规则的属性值约简算法.  相似文献   

10.
基于有权重支持度框架的关联规则挖掘算法和超图分割算法, 给出一种新的基于有权重超图模型的离群点检测算法WHOT(Weighted Hypergraph based Outlier Test). WHOT算法根据有权重支持度的定义, 重新设计了基于有权重支持度框架的关联规则挖掘算法, 并挖掘出数据集中的重要关联规则, 形成超图. 在超图上应用超图分割算法, 得到聚类集合, 再结合项权重和事务权重的定义, 判断一条记录是否为离群数据.  相似文献   

11.
基于集合运算的频繁集挖掘优化算法   总被引:1,自引:0,他引:1  
挖掘关联规则是数据挖掘中一个重要的课题,产生频繁项目集是其中的一个关键步骤。 提出了一种基于集合运算的频繁项目集挖掘算法,并将该算法与经典算法Apriori进行比较。该算法只需要对数据库扫描一遍。实验表明该算法的效率较好。  相似文献   

12.
从数据挖掘的一般性定义入手,给出了EIS环境下数据挖掘的概念和过程.并根据EIS和数据挖掘各自的特点,以概念树算法和决策树算法为例,在分析了它们的算法原理的基础上,探讨了通过属性值间概念存在的层次关系实现EIS数据查询的逐级细化;根据信息论原理,以分类学习为基础,通过计算各属性所含信息量大小,得出判断规则,为EIS辅助决策提供支持.  相似文献   

13.
随着数据仓库技术的发展,数据挖掘技术和联机处理成为建立决策支持系统的重要工具,本文探讨了数据挖掘技术在市场营销决策支持系统中应用的方法、算法和建立知识库管理系统的策略,提出了建立IDSS系统的结构、功能和步骤。  相似文献   

14.
关联规则挖掘在学生成绩管理中的应用   总被引:3,自引:0,他引:3  
数据挖掘给人们提供了一种新的认识数据、理解数据的智能手段,关联规则是数据挖掘的一种重要模式。本文在研究关联规则挖掘技术的基础上,将数据挖掘技术和关联规则算法运用到学生成绩管理中:以某班学生在校成绩为数据源,分析了课程间的影响关系,从而能够发现导致留级、退学的那些课程。  相似文献   

15.
决策树是分类数据挖掘的重要方法。C4.5算法延用了经典ID3算法的基本策略,增加了处理连续属性的方法。在C4.5算法的基础上,讨论了新的基于属性变换的连续属性处理方法。该方法基于统计概率信息,依据概率属性的最佳分裂对应分裂连续属性,增加了决策树的分类精度。  相似文献   

16.
现代信息数据的挖掘与发展   总被引:1,自引:0,他引:1  
数据挖掘作为一项从海量数据中提取知识的新技术引起学术界和产业界的极大重视。笔概括了数据挖掘的几种常见模式.如依赖模式、层次模式、序列模式等,并对这几种数据挖掘模式的特点进行了比较;阐述了从数据中提取知识的几种挖掘算法,如决策树、神经网络方法、遗传算法等;展望了数据挖掘模式和挖掘算法的发展趋势。  相似文献   

17.
数据挖掘就是利用机器学习的方法从大量数据中提取有价值知识的过程.本文以运动员体能测试数据为分析对象,研究应用数据挖掘技术解决运动员体能指标优化分析问题的方法.文中重点介绍了关联规则挖掘的原理与方法,提出并实现了适宜于网球运动员体能指标优化分析的算法,并进行了实际应用,发现了出乎常规的规律.  相似文献   

18.
提出了一款基于Hadoop的并行数据分析系统——PDM.该系统拥有大量以MapReduce为计算框架的并行数据分析算法,不仅包括传统的ETL、数据挖掘、数据统计和文本分析算法,还引入了基于图理论的SNA(社会网络分析)算法.详细阐述了并行多元线性回归算法和"多源最短路径"算法的原理和实现,其中,提出的"消息传递模型"能有效解决MapReduce难以处理邻接矩阵的问题;介绍了基于电信数据的典型应用,如采用并行k均值和决策树算法实现的"套餐推荐",利用并行PageRank算法实现的"营销关键点发现"等;最后通过性能测试,说明该系统适合高效地处理大规模数据.  相似文献   

19.
分析了仿生学应用于空间数据挖掘的必要性及可行性;阐述了神经网络、遗传算法和基因表达式编程的应用研究;探讨了空间数据挖掘仿生学方法以及空间数据挖掘仿生学方法的未来发展.  相似文献   

20.
基于数组的频繁项目集的挖掘算法   总被引:4,自引:0,他引:4  
挖掘关联规则是数据挖掘研究的一个重要方面.然而,目前提出的算法仍存在一些问题,如复杂的数据结构、大量的候选频繁项目集生成等等.本文提出使用了一种简单的数据结构——数组,并提出了基于数组的一种新的频繁项目集的挖掘算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号