首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
关联规则Apriori算法的改进   总被引:7,自引:0,他引:7  
Apriori算法是关联规则提取的经典算法,但存在一些不足之处。关联算法的研究主要集中在提高Apriori算法的效率上。本文分析了该算法并进行了改进,使得频繁集产生的同时精简事务集。这种算法及时去掉了不必要的数据,减少了数据运算,从而使算法更优化。  相似文献   

2.
挖掘关联规则Apriori算法的一种改进   总被引:1,自引:0,他引:1  
本研究在对Apriori算法分析的基础上,提出了改进的Apriori算法。改进后的算法采用矩阵表示数据库,减少了扫描事物数据库的次数;利用向量运算来实现频繁项集的计数,同时及时地去掉不必要的数据,减少了数据运算,从而提高了算法的运行效率。  相似文献   

3.
针对Apriori算法存在多次扫描数据库及产生大量候选项集的缺陷,提出了一种改进算法.该算法只需扫描数据库一次,并将事务变换成二进制存储到数据库,可节省存储空间、提高速度.实验结果表明,改进算法挖掘关联规则的效率有较大提高.  相似文献   

4.
利用项集有序特性改进Apriori算法   总被引:4,自引:2,他引:4  
Apriori算法是挖掘关联规则的一个经典算法,通过分析、研究该算法的基本思想,并利用项集的有序特性对其进行改进,减少了生成的候选集数量,从而提高算法的效率.  相似文献   

5.
一种改进的Apriori算法   总被引:2,自引:0,他引:2  
分析Apriori算法的不知,提出从先删减后连接的新角度来生成频繁项集,达到减少无用连接,进而减少剪枝步骤候选项集判断数量来改进Apriori算法。改进后的Apriori算法在时间效率上优于传统的算法,而且所获得的关联规则质量与传统算法相当。  相似文献   

6.
Apriori算法的分析与改进   总被引:1,自引:0,他引:1  
随着网上信息的不断增加,越来越多的用户迷失在信息的海洋中,如何利用有效的方法和手段从大量的信息中找出有价值、能为用户所用的知识,是数据挖掘的主要任务.由于Apriorl算法在频繁模式挖掘过程中需要多次扫描数据库、算法运行时间较长,因此笔者提出一种改进的Apriori算法——FPMUDF(频繁模式挖掘利用动态函数)算法,这种算法利用事务ID进行配对,从而产生频繁项目集,减少了算法运行的时间,较好的提高了算法的性能.  相似文献   

7.
本文分析了关联规则的经典算法Apriori算法,对该算法存在的不足进行了讨论,针对这些不足介绍了一些主要的算法改进方法和思路,并提出了一种基于矩阵的Apriori改进算法,通过减少对数据库的操作来提高效率.  相似文献   

8.
本文分析了关联规则的经典算法Apriori算法,对该算法存在的不足进行了讨论,针对这些不足介绍了一些主要的算法改进方法和思路,并提出了一种基于矩阵的Apriori改进算法,通过减少对数据库的操作来提高效率。  相似文献   

9.
李忠慧 《科技信息》2009,(24):192-193
在数据挖掘中,关联规则是发现知识的一种有效方法。该文在分析关联规则挖掘Apriori算法原理和性能的基础上,并提出了一种效率更高的改进算法。该算法是基于散列和事务压缩这两种技术。散列技术可以显著地压缩要考察的候选项集,事务压缩可以减少数据库中的事务项,从而提高Apriori算法效率。  相似文献   

10.
对Apriori算法的一种改进   总被引:2,自引:0,他引:2  
给出了一种对Apriori算法改进的算法。改进的算法只需扫描一次数据库D,同时简化了Apriori算法,减少了存储设备I/O时间,提高了算法的效率。  相似文献   

11.
Apriori算法是经典的数据挖掘算法之一,它根据置信度和支持度对产生的频繁集进行选择,找出强规则.传统的Apriori算法需要产生大量的侯选集和多次数据库的扫描,存储和通信的开销巨大.云计算环境可以解决存储问题,所以针对Mapreduce的编程框架,提出一种适用于此模式的新关联规则算法,解决传统Apriori算法时间和空间上的缺点,提高挖掘效率.  相似文献   

12.
关联规则是数据挖掘的主要技术之一.本文针对目前最经典的关联规则挖掘Apriori算法的局限性,提出了一种只扫描一遍事务数据库的效率较高的Apriori_Tid-1算法,并给出了一个具体的实例,最后给出了该算法的实现.  相似文献   

13.
针对Apriori算法的不足,提出了一种新的优化算法——IApriori.该算法应用散列技术优化产生频繁-2项集,优化连接操作减少连接判断的次数,通过对候选项集编码来减少扫描数据库的次数,优化逻辑"与"运算减少不必要的"与"操作次数,缩短生成频繁项集的时间.IApriori算法仅需3次扫描数据库.研究结果表明,该算法具有快速、直观、节省内存等优点.  相似文献   

14.
关联规则是数据挖掘的一个重要研究内容,主要用于从大量数据集中挖掘出有价值的数据项之间的关联关系.典型案例是超市的购物篮分析,主要对顾客的购买记录数据库进行关联规则挖掘,可以发现顾客的购买行为.本文依据Apriori算法的两个基本性质,即任何大项集的子集一定是大项集,非大项集的超集一定是非大项集,对经典的Apriori算法要多次扫面事务数据库的问题,作了一些改进,并进行仿真计算,结果表明,改进的算法确实减少了扫描次数.  相似文献   

15.
经典的关联规则求解算法(如Apriori算法)是串行算法,当数据量比较大时挖掘效率较低;提出了新的并行BVP算法,BVP算法通过多线程并行读取数据并计算相应的数据特征,然后计算频繁项集和关联规则;实验结果表明:相对于经典Apriori算法,算法执行效率更高。  相似文献   

16.
改进购物篮分析的关联规则挖掘算法   总被引:5,自引:1,他引:5  
基于改进传统购物篮分析的关联规则挖掘是在数据处理时引入兴趣度加权的思想,将所有交易中同一类商品的交易量进行归一化处理,根据用户领域知识的要求,计算该类商品的兴趣度加权阈值,从而改进传统的购物篮分析,使所挖掘出的关联规则符合实际,同时减少关联规则挖掘的工作量,提高规则挖掘的效率和准确性.  相似文献   

17.
Apriori算法的复杂性研究   总被引:1,自引:0,他引:1  
袁鼎荣  严小卫 《广西科学》2005,12(2):115-117,122
介绍关联规则挖掘及Apriori算法,分析事务数据库的特性及Apriori算法的复杂性,指出频繁项集挖掘算法的优化途径.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号