首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
Apriori算法是经典的关联规则挖掘算法,主要缺点是可能产生大量的候选集和需要多次扫描数据库.从幂集运算的角度提出了一种新的关联规则挖掘算法P_DM算法,实现了只需要扫描一次数据库就产生所有频繁集.实验证明这种算法在中小规模数据挖掘上效率优于Apriori算法.  相似文献   

2.
本文提出了一种通用的增量式关联规则挖掘算法MIAR,可用于数据库更新改变时的挖掘.研究并提出了增量式关联规则挖掘中的重要性质,充分利用上一次挖掘出的知识,对候选项集进行修剪.确定了一种启发式的数据库选择扫描策略,在保证候选项集数不会增长很快的情况下,减少数据库扫描次数,有效提高算法的时间性能.大量数据试验算法优越于Apriori和FUP2.  相似文献   

3.
关联规则挖掘是数据挖掘中的一个重要课题,常用的Apriori 算法要多次扫描数据库,会产生大量的候选项集.利用向量的内积运算和逻辑运算提出了一种关联规则挖掘的改进算法.研究表明,该算法运算简单,只需要扫描一次数据库,不需要产生候选项集,且具有处理大型数据库的优点.  相似文献   

4.
针对Apriori算法存在多次扫描数据库及产生大量候选项集的缺陷,提出了一种改进算法.该算法只需扫描数据库一次,并将事务变换成二进制存储到数据库,可节省存储空间、提高速度.实验结果表明,改进算法挖掘关联规则的效率有较大提高.  相似文献   

5.
分析了关联规则挖掘的各种算法,详尽分析和探讨了一种用于挖掘关联规则的矩阵算法并给出了矩阵算法实现过程.矩阵算法扫描数据库一次,然后生成事务矩阵,在矩阵上进行相关的数据挖掘操作.当数据库规模较大时,矩阵算法能够显著提高关联规则挖掘的效率.  相似文献   

6.
Apriori算法是一种经典的关联分析挖掘算法.经典Apriori算法计算效率偏低,并且需要多次扫描数据库.针对这些问题,文章提出了基于Hash表改进的Apriori算法.基于Hash表的改进Apriori算法计算时只需扫描对应频繁项集Hash表中对应的项,缩小了扫描范围,并且只需要扫描一次数据库.对比经典的Apriori算法,性能具有显著提高.  相似文献   

7.
提出了基于数组的关联规则挖掘算法,该算法只扫描一次数据库,将数据库中的数据存于数组中,提高了内存的利用效率,同时也提高了算法效率.  相似文献   

8.
关联规则算法是数据挖掘中的核心技术,本文给出了数据库中挖掘关系规则的一种新算法,该算法通过二次扫描,第一次将可能出现的频繁项目集加入到ISC中,第二次扫描采用逐步求精算法将频繁项目集加到项目集中,减少了数据库的扫描次数.  相似文献   

9.
基于向量的频繁项集挖掘算法研究   总被引:1,自引:0,他引:1  
针对Apriori算法寻找频繁项集时,需要多次扫描事务数据库和可能产生大量候选项集的问题,提出了一种向量和数组相结合的频繁项集挖掘算法。该算法不仅实现了只扫描事务数据库一次,而且避免了模式匹配,减少了无价值的候选项集的产生。通过与已有算法的比较,验证了本文算法具有较高的挖掘效率,而且数据库的项数越多,此算法的挖掘效果越明显。  相似文献   

10.
一种基于关联规则的数据挖掘算法实现与应用   总被引:1,自引:0,他引:1  
对Apriori算法加以改进,提出了一种更高效的关联规则挖掘算法,在扫描数据库的同时把支持每个项目的事务都标记出来,采用一种新的方法来计算候选项目集的支持度.该算法只需对源数据库进行一次扫描,就可以找出所有的频繁集,具有很高的效率.  相似文献   

11.
关联规则是数据挖掘中的一个重要研究方向.经典的Apriori算法是一种最有影响的挖掘布尔型关联规则频繁项集的算法,但其并不适合挖掘近年来兴起的多维数据模型.在改进Apriori算法的基础上,提出了一种"二次剪枝"的算法,此算法适用于挖掘多维关联规则,并且在一定程度上提高了算法效率.  相似文献   

12.
最频繁项集挖掘是文本关联规则挖掘中研究的重点和难点,它决定了文本关联规则挖掘算法的性能.针对当前在最频繁项集挖掘方面的不足,改进传统的倒排表,并结合最小支持度阈值动态调整策略,提出一个新的基于改进的倒排表和集合理论的最频繁项集挖掘算法.另外,给出几个命题和推论,并把它们用于本文算法以提高性能,最后对所提算法进行实验验证.实验结果表明,该算法的规则有效率和时间性能比常用的两个最频繁项集挖掘算法(NApriori算法,IntvMatrix算法)都好.  相似文献   

13.
一种基于改进型遗传算法的关联规则提取算法及其应用   总被引:3,自引:0,他引:3  
对关联规则的数据挖掘和遗传算法进行了概述,阐述了关联规则数据挖掘的现实意义,提出了一种采用改进型遗传算法的关联规则提取方法,并给出了具体的算法,最后结合一个具体实例进行了应用。  相似文献   

14.
夏龄 《科学技术与工程》2012,12(35):9545-9551
数据挖掘并行算法,应该以不牺牲挖掘效率和挖掘质量为前提。通过对数据挖掘原理和并行化的深入研究,在考虑到挖掘效率,负载平衡,运行环境,节点状态等多方面因素的基础上,提出了一种新的基于动态调度的数据挖掘并行算法。该算法以规模较小的子数据集为并行挖掘单元,各个并行单元之间采用全局通讯模式—Master-Worker模式来进行互相通信。降低了并行挖掘的通信成本,提高了挖掘的效率,缩短了挖掘的时间。同时该算法对不断变化的节点状态适应能力强。最后,实验结果验证了该算法的有效性以及在大数据集挖掘应用中的优越性。该算法不但保证了挖掘结果的正确性,而且具有较高的加速比。  相似文献   

15.
The paper studies the problem of incremental pattern mining from semi-structrued data. When a new dataset is added into the original dataset, it is difficult for existing pattern mining algorithms to incrementally update the mined results. To solve the problem, an incremental pattern mining algorithm based on the rightmost expansion technique is proposed here to improve the mining performance by utilizing the original mining results and information obtained in the previous mining process. To improve the efficiency, the algorithm adopts a pruning technique by using the frequent pattern expansion forest obtained in mining processes. Comparative experiments with different volume of initial datasets, incremental datasets and different minimum support thresholds demonstrate that the algorithm has a great improvement in the efficiency compared with that of non-incremental pattern mining algorithm.  相似文献   

16.
关联规则挖掘算法FP-Growth在挖掘大型数据库时,占用内存大、运行速度慢或根本无法构造基于内存的FP-tree。针对这些问题,文章提出一种适合于挖掘较大型数据库的新的关联规则挖掘算法DFP-Growth,新算法将数据库分解,然后对分解得到的各个数据库子集用FP-Growth算法进行约束频繁项集挖掘,以满足大型数据库挖掘的需求。  相似文献   

17.
在挖掘关联规则的过程中,关键步骤是产生频繁项集.基于频繁项集支持矩阵的思想,提出一种有效的频繁项集挖掘算法-FIMA,并给出了算法的基本设计思想和算法描述.本算法利用矩阵挖掘频繁项集,不需要产生候选项集,且只需扫描数据库一次。所以此算法是非常有效的.  相似文献   

18.
苏耿  潘雪梅 《中国西部科技》2009,8(32):11-12,25
文章在分析研究关联规则挖掘Apriori算法的基础上,对Apriori算法做了进一步改进。改进的算法采用压缩候选项的方式,大大减小了不必要的开销,从而提高了挖掘速度。  相似文献   

19.
Constraint pushing techniques have been developed for mining frequent patterns and association rules. How ever, multiple constraints cannot be handled with existing techniques in frequent pattern mining. In this paper, a new algorithm MCFMC (mining complete set of frequent itemsets with multiple constraints) is introduced. The algorithm takes advantage of the fact that a convertible constraint can be pushed into mining algorithm to reduce mining research spaces. By using a sample database, the algorithm develops techniques which select an optimal method based on a sample database to convert multiple constraints into multiple convert ible constraints, disjoined by conjunction and/or, and then partition these constraints into two parts. One part is pushed deep inside the mining process to reduce the research spaces for frequent itemsets, the other part that cannot be pushed in algorithm is used to filter the complete set of frequent itemsets and get the final result. Results from our detailed experi ment show the feasibility and effectiveness of the algorithm.  相似文献   

20.
关联规则数据挖掘方法的研究   总被引:1,自引:0,他引:1  
在数据挖掘技术中有很多研究领域,关联规则数据挖掘就是其中一个重要的研究方向,对它进行深入研究不仅有着重要的理论意义,而且有着极其重要的应用价值。分析和研究Apriori算法,针对该算法中存在的效率瓶颈问题,提出了一个改进的挖掘算法FDBM_Apriori算法,并实现了该算法。理论和实验证明,FDBM_Apriori算法具有良好的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号