首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对Apriori算法产生大量候选集和多次扫描事务数据库的不足之处,本文提出一种基于模式向量的与和或运算的关联规则挖掘算法Association Rule Mining Algorithm Basedon ModeVector(ARMV)。该算法首先提出通过模式向量的或运算来减少生成的候选集数量。然后采用模式向量与事务矩阵的与运算来判断候选模式向量是否为频繁集。同时对事务矩阵的行设置flag,删除flag为0的行。每个候选模式矩阵只需扫描事务矩阵一次。实验表明ARMV算法比Apriori算法具有更好的性能和效率。  相似文献   

2.
Apriori算法是当前使用最广泛的关联规则挖掘方法中最为经典的算法之一;但是该算法需要反复的扫描数据库,在L/O上花消很大,并且在得到频繁一2项集的过程中会产生庞大的候选一2项集,其次在筛选得到频繁一k项集时,并没排除那些不应该参组合的元素,而导致该算法效率很低,针对上面影响计算效率的三个方面提出基于压缩事务矩阵相乘得到频繁项目集的算法,只需一次扫描数据库,经过压缩处理产生产生事务矩阵,通过矩阵间运算得到频繁项目集,有效提高了关联规则的挖掘效率。  相似文献   

3.
FP—Growth算法是关联规则挖掘的一个经典算法。本文提出一种基于事务一项矩阵的挖掘算法MFP—Growth算法,利用向量矩阵表示事务数据库,整个挖掘过程只扫描一遍数据库,通过构造各个频繁项的条件矩阵,利用条件矩阵的向量运算来进行频繁模式的挖掘,减少了算法占用的内存空间,提高了挖掘效率.实验结果表明,MFP—Growth算法是有效可行的.  相似文献   

4.
产生频繁项目集是关联规则挖掘中的一个关键步骤.在对Apriori算法分析的基础上,提出了一种基于集合和位运算的频繁项目集挖掘算法.该算法用位视图表示使用了每个项目的事务,通过对位视图进行位运算来计算每个项目集的支持数,避免了Apriori算法中多次扫描数据库的问题.  相似文献   

5.
关联规则挖掘是数据挖掘中的一个重要课题,常用的Apriori 算法要多次扫描数据库,会产生大量的候选项集.利用向量的内积运算和逻辑运算提出了一种关联规则挖掘的改进算法.研究表明,该算法运算简单,只需要扫描一次数据库,不需要产生候选项集,且具有处理大型数据库的优点.  相似文献   

6.
Apriori算法是经典的关联规则挖掘算法,主要缺点是可能产生大量的候选集和需要多次扫描数据库.从幂集运算的角度提出了一种新的关联规则挖掘算法P_DM算法,实现了只需要扫描一次数据库就产生所有频繁集.实验证明这种算法在中小规模数据挖掘上效率优于Apriori算法.  相似文献   

7.
基于集合运算的频繁集挖掘优化算法   总被引:1,自引:0,他引:1  
挖掘关联规则是数据挖掘中一个重要的课题,产生频繁项目集是其中的一个关键步骤。 提出了一种基于集合运算的频繁项目集挖掘算法,并将该算法与经典算法Apriori进行比较。该算法只需要对数据库扫描一遍。实验表明该算法的效率较好。  相似文献   

8.
为减少关联规则挖掘中数据库扫描次数,提出了一种基于准频繁项目集的关联规则挖掘算法———SupposedFrequent,同时给出了候选频繁项目集的产生函数———BGen.最后通过实验证明:在给定最好的准频繁项目集的条件下,只需扫描数据库两次就能产生全部的频繁项目集。  相似文献   

9.
提出一种基于粗糙集理论和布尔矩阵的关联规则挖掘算法,作为对Apriori算法的改进,通过构造布尔矩阵,利用粗糙集划分等价类的方法对事务数据库的记录进行分类,然后通过等价类的取交或取并运算产生更高阶的频繁项目集,算法能有效减少数据库的扫描次数,实验表明算法在对事务数据库进行挖掘时显示出良好的性能.  相似文献   

10.
在挖掘关联规则的过程中,关键步骤是产生频繁项集.基于频繁项集支持矩阵的思想,提出一种有效的频繁项集挖掘算法-FIMA,并给出了算法的基本设计思想和算法描述.本算法利用矩阵挖掘频繁项集,不需要产生候选项集,且只需扫描数据库一次。所以此算法是非常有效的.  相似文献   

11.
关联规则算法是数据挖掘中的核心技术 ,本文给出了数据库中挖掘关系规则的一种新算法 ,该算法通过二次扫描 ,第一次将可能出现的频繁项目集加入到ISC中 ,第二次扫描采用逐步求精算法将频繁项目集加到项目集中 ,减少了数据库的扫描次数  相似文献   

12.
关联规则算法是数据挖掘中的核心技术,本文给出了数据库中挖掘关系规则的一种新算法,该算法通过二次扫描,第一次将可能出现的频繁项目集加入到ISC中,第二次扫描采用逐步求精算法将频繁项目集加到项目集中,减少了数据库的扫描次数.  相似文献   

13.
Apriori算法是关联规则挖掘中最经典的算法,但它存在两大致命缺陷:需多次扫描数据库和产生海量的候选项目集。从这两个角度出发改进算法,提出了一种基于模式矩阵的高效改进算法(简称P-Matrix算法),使扫描数据库的次数减少为一次,同时不产生候选项目集而直接产生频繁项目集,从而使算法的时间复杂度和空间复杂度大大减少,有效地提高了Apriori算法的效率。  相似文献   

14.
 针对现有拓扑关联规则挖掘算法不能够有效地提取长频繁约束拓扑关联规则,提出一种基于区间映射的约束拓扑关联规则挖掘算法,该算法适合挖掘带约束空间布局关系的长频繁拓扑关联规则;该算法用区间映射法的下行搜索策略产生候选频繁拓扑项目集,利用逻辑"与"运算计算拓扑关系事务的支持数.实验证明在挖掘长频繁约束拓扑项目集时,该算法比现有算法更快速更有效.  相似文献   

15.
为提高挖掘大项目集的速度,有效建立给定数据集中各项集之间的关联规则,提出了一种0-1矩阵关联规则数据挖掘算法.算法将事务数据库转化成M×N的矩阵,构造一个矩阵关联图表示频繁1-项目集中每两个项目之间的关联关系,通过遍历构造的关联矩阵有效地缩减事务数据库的大小,产生所有的频繁项集.利用模拟实验结果证明了所提算法可行性及有效性.  相似文献   

16.
基于有向图的关联规则挖掘算法研究   总被引:2,自引:0,他引:2  
为了提高关联规则挖掘效率,提出了一种基于有向图的频繁项目集挖掘算法DGBFIG(Directed graph -based frequent itemsets generation).该算法采用位矢量技术构造有向图,表示项与项之间的频繁关系,并在有向图的基础上递归产生频繁项集,从而只需扫描数据库2次,不产生候选集,从而大大提高了关联规则挖掘算法的效率.最后从空间和时间的复杂度分析了该算法的效率.  相似文献   

17.
基于聚类矩阵的CM—Apriori算法研究   总被引:1,自引:0,他引:1  
针对关联规则中Apriori算法的不足,提出了一种基于聚类矩阵的CM-Apriori新算法.该算法只需扫描事务数据库一次,就直接按事务项数生成聚类矩阵,每次只需对部分聚类矩阵进行运算,就可以生成频繁项集.这大大减少了扫描数据库的次数和计算成本,从而有效提高了算法的运算效率,并通过实例说明了它是一种有效的关联规则挖掘方法.  相似文献   

18.
Apriori算法是关联规则挖掘的经典算法,具有原理简洁、易编程实现等优点,得到广泛应用。针对该算法扫描数据库次数过多,产生大量冗余候选集的缺陷,在现有Apriori算法改进优化思想的基础上,结合矩阵、改进频繁模式树和计算候选集频数优化策略提出了一种改进的关联规则挖掘算法——MIFP-Apriori算法。实验表明,该算法能够将扫描数据库次数降低到一次,有效解决产生大量冗余候选集的缺陷,提高算法效率。  相似文献   

19.
基于关系代数的关联规则挖掘算法   总被引:3,自引:0,他引:3  
目的提出基于关系代数理论的关联规则挖掘算法。方法利用数据预处理方法,剔除无关属性、获得相应的目标特征子集。结果基于目标特征子集,利用关系矩阵及相关运算给出了搜索大项集的基于关系代数理论的优化的关联规则挖掘算法,该算法只需扫描数据库一次。结论克服了经典的Apriori算法需要多次扫描数据库的缺点,同时算法具有良好的并行性和可伸缩性。  相似文献   

20.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有意义的关联。随着大量数据不停的收集和存储,从数据库中挖掘关联规则显得越来越有必要性,关联规则挖掘的Apriori算法是数据库挖掘的最经典算法并得到广泛应用,在介绍关联规则挖掘和Apriori算法的基础上,发现Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。综述了Apriori算法的主要优化方法,并指出了Apriori算法在实际中的应用领域,提出了未来Apriori算法的研究方向和应用发展趋势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号