首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
设计了一种不同于传统关联规则挖掘算法(如Apriori算法等)频繁项集产生算法.该算法借鉴一般免疫算法思想,并从新的角度来看频繁项集的定义,避免了传统算法中存在的"项集生成瓶颈"问题.通过对mushroom数据的频繁项集挖掘的实验,与传统方法进行了比较,其结果表明,基于免疫算法的频繁项集挖掘算法在大数据集、低支持度情况下平均挖掘时间短.  相似文献   

2.
数据挖掘技术的发展为分析高速公路收费站海量统计资料提供了便利,通过对数据挖掘技术内容及其分类的简单介绍,运用关联规则并使用数据挖掘软件Weka对广靖锡澄高速公路无锡收费站的部分统计数据进行离散化处理,借助Apriori算法对影响收费站收费效率的收费时段、车辆进站速度、车辆收费平均时耗、收费车辆数、收费车型、收费费用、收费站进口道长度、天气等因素进行关联性挖掘,认为高速公路收费站的收费数据关联性较大的是收费时间、进站车速、收费车辆数、收费站规模等因素,对于解决收费排队过长、排队车辆控制、收费费率调整、收费站进出口道数量的设置、收费站规模设置等等提供了一定的参考价值。  相似文献   

3.
从大型事务数据库中发现关联规则是数据挖掘中的一个重要课题,其核心问题是挖掘频繁项集.经典Apriori算法是有效的挖掘频繁项目集的算法.在分析Apriori算法的基础上,提出了一种利用二维数组来代替算法中的哈希树的方法,可以迅速产生二阶频繁项目集,改善了Apriori算法的效率瓶颈,大大提高了算法的执行效率.  相似文献   

4.
阐述了关联规则挖掘对象事务数据库的特性, 对关联规则挖掘的关键问题频繁项集的几种挖掘方法:Apriori算法、最大频繁项集的挖掘算法、基于频繁链表的频繁项集挖掘算法作了分析研究,并指出了频繁项集挖掘算法优化的必要途径  相似文献   

5.
Apriori算法是关联规则数据挖掘领域中最重要的挖掘方法,针对Apriori算法中挖掘频繁项集的效率问题和产生关联规则的合理性问题,改进相关定义及其使用,并提出改进的Apriori算法,然后将改进算法用于教学评价仿真系统.仿真结果表明,改进算法可高效、合理地挖掘关联规则,为做好课程安排和教学工作提供支持.  相似文献   

6.
在分布式系统中如何挖掘关联规则是数据挖掘领域研究的一个重要课题.对关联规则分布式挖掘问题进行了深入探讨.基于以P2P网络模式构建的分布式事务数据库,对Apriori算法进行了推广.改进后的算法具有扩展性好、效率高、通信代价小和实现简单等优点.最后,还提出了一种由频繁项集高效产生强关联规则的算法.  相似文献   

7.
基于数据库约简的关联规则挖掘算法   总被引:7,自引:0,他引:7  
通过对Apriori算法挖掘过程进行分析,提出了一种基于数据库约简的关联规则挖掘算法.该算法利用每趟挖掘中一些非频繁项集的超集、并集,逐步约简事务数据库中的事务,提高了关联规则的挖掘效率.在这些非频繁项集的基础上建立了数据库约简的定理和推论,并在Apriori算法的基础上设计了ApioriNEW算法.经过对算法进行分析和实验,算法ApioriNEW的挖掘效率比较高.一般情况下,平均可将挖掘效率提高约30%.ApioriNEW算法特别适合大型数据库的关联规则挖掘,已应用在网络故障诊断专家系统的知识获取中.  相似文献   

8.
识别所有频繁项集是Apriori算法的核心.结合偏好信息的思想,对关联规则中的Apriori算法进行改进,减少候选频繁集冗余,提高了算法效率,并对学生成绩进行挖掘分析,找到影响成绩的内在因素.  相似文献   

9.
在众多的关联规则挖掘算法中,Apriori算法是最为经典的一个,但Apriori算法有以下缺陷:需要扫描多次数据库、生成大量候选集以及迭代求解频繁项集。因而提出了一种新方法,使Apriori算法产生的候选项集再通过数据库查找是否为频繁项集,从而提高算法的效率。最后针对入侵检测系统形成关联规则。实验结果表明,改进后的算法...  相似文献   

10.
提高频繁项集挖掘算法的效率一直是数据挖掘领域中关联规则挖掘研究的一个重点。Apriori算法是一种经典的最有影响的挖掘关联规则的算法,该算法虽然能有效地挖掘出关联规则,但是产生的冗余规则多,效率低下。针对数据挖掘的现状及关联规则算法的瓶颈问题,提出一种基于串与运算的关联规则挖掘算法,并对关联规则挖掘的未来研究方向进行了展望。  相似文献   

11.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有意义的关联。随着大量数据不停的收集和存储,从数据库中挖掘关联规则显得越来越有必要性,关联规则挖掘的Apriori算法是数据库挖掘的最经典算法并得到广泛应用,在介绍关联规则挖掘和Apriori算法的基础上,发现Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。综述了Apriori算法的主要优化方法,并指出了Apriori算法在实际中的应用领域,提出了未来Apriori算法的研究方向和应用发展趋势。  相似文献   

12.
针对关联规则挖掘中传统Apriori算法需要通过多次扫描数据库来发现频繁项集的问题,提出一种基于简单双矩阵的方法来实现频繁项集的发现.该方法仅需要扫描数据库一次,并充分利用项集的出现次数和是否出现逻辑值来获取频繁项集.实验表明,该方法比Apriori算法更高效.  相似文献   

13.
在数据库中挖掘关联规则是数据挖掘领域的一个重要的研究课题,在应用中具有非常重要的意义.在分析Apriori算法和IUA算法经典关联规则挖掘算法的基础上,提出了一种基于最近挖掘结果的更新算法称为IIUA.IIUA算法吸收了Apriori算法和IUA算法的优点,在改变最小支持度和基于最近挖掘结果的条件下,从生成尽可能少的候选项集考虑,得到完整的新频繁项集,从而提高算法的效率.  相似文献   

14.
为在Web日志数据中挖掘关联规则以指导信息无障碍网站的设计与开发, 针对大量用户对网站页面URL(Uniform Resoure Locator)的访问频率等信息, 通过Apriori算法实
现数据挖掘, 以寻找用户访问页面之间的关联规则。根据3次点击原则及网站结构设计的特点, 对Apriori 算法网页超链接挖掘的过程进行了改进, 频繁项集最多只需找出所有3
-项集即可。算法实现过程表明, 该方法可有效降低算法的时间复杂度, 能通过对关联规则的分析确定用户感兴趣的网页类型, 找出用户所访问网页之间的链接关系。  相似文献   

15.
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,如果采用Apriori类的候选项目集生成一检验方法,则候选项目集生成的代价通常很高.为寻求避免生成大量候选项集或生成频繁模式树的挖掘算法,提出一种从事务项集交集求最大频繁项集的迭代算法DIIP(Datasets Iteration and Intersection Pruning Algorithm),通过不断缩减事务集数据量和尽可能早地对项目集进行修剪实现最大频繁项集的挖掘,该算法有别于已有的最大频繁项集经典算法,实验表明该算法有效可行.  相似文献   

16.
关联规则是数据挖掘中的一个重要研究方向.经典的Apriori算法是一种最有影响的挖掘布尔型关联规则频繁项集的算法,但其并不适合挖掘近年来兴起的多维数据模型.在改进Apriori算法的基础上,提出了一种"二次剪枝"的算法,此算法适用于挖掘多维关联规则,并且在一定程度上提高了算法效率.  相似文献   

17.
一种改进的Apriori算法   总被引:3,自引:0,他引:3       下载免费PDF全文
介绍了关联规则挖掘的情况,并在分析关联规则的数据挖掘算法的基础上,提出一个改进的Apriori算法.新算法仅对数据库扫描一次,就能找出所有的频繁项集,从而提高了挖掘的效率,具有一定的实用性  相似文献   

18.
Apriori算法是关联规则挖掘中的经典算法,一直是数据挖掘领域的研究热点。传统的Apriori算法由于产生过多的无用的候选项集以及需要多次扫描数据库导致在一定程度上限制了算法的效率。本文针对这一问题,提出一种新的RF-Apriori算法。该算法首先对数据进行二元处理;然后利用项集的反单调性减少候选项集的产生,从而提高算法效率。实验结果表明,RF -Apriori算法效率明显优于Apriori算法。  相似文献   

19.
针对Apriori算法在面对大规模数据时效率较低的问题,提出了一种基于划分和压缩数据库的改进方法。该方法首先依据特征数据出现的频率将数据按照升序存储在临时数组中;然后将原始事务数据库分为几个互不相交的事务数据库,使得子数据库能够容纳在内存中;最后根据每个子数据库计算出的频繁项集计算整个数据库的频繁项集,从而消除了不必要的冗余数据。通过改进可以将大规模数据集进行有效的划分和压缩,对子数据库进行关联规则挖掘。实验结果表明,改进的Apriori算法在针对海量数据挖掘的执行速度和效率都有很大提高。  相似文献   

20.
介绍数据挖掘中关联规则的情况.在分析关联规则挖掘算法的基础上,对经典Apriori算法进行改进,改进算法意在通过减少生成候选频繁项集的数量和扫描数据库次数.从而,加快算法的执行效率和节省空间.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号