首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 46 毫秒
1.
从大型事务数据库中发现关联规则是数据挖掘中的一个重要课题,其核心问题是挖掘频繁项集.经典Apriori算法是有效的挖掘频繁项目集的算法.在分析Apriori算法的基础上,提出了一种利用二维数组来代替算法中的哈希树的方法,可以迅速产生二阶频繁项目集,改善了Apriori算法的效率瓶颈,大大提高了算法的执行效率.  相似文献   

2.
Apriori算法是一种经典的关联分析挖掘算法.经典Apriori算法计算效率偏低,并且需要多次扫描数据库.针对这些问题,文章提出了基于Hash表改进的Apriori算法.基于Hash表的改进Apriori算法计算时只需扫描对应频繁项集Hash表中对应的项,缩小了扫描范围,并且只需要扫描一次数据库.对比经典的Apriori算法,性能具有显著提高.  相似文献   

3.
针对Apriori算法在第二次迭代过程中产生大量候选集的弊端,在Spark大数据框架下,将Apriori算法进行并行化处理。提出一种基于Spark平台的改进Apriori算法——I-Apriori;该算法利用Spark基于内存计算的抽象对象(RDD)存储频繁项集,在第二次迭代中,通过使用改进的布隆过滤器存储频繁1项集,消除候选集生成,减少数据库扫描次数,提高算法效率。实验结果表明,相比基于Spark平台的Apriori算法进行性能评估,I-Apriori算法具有更优的性能,能够较大程度地提高大数据关联规则挖掘的效率。  相似文献   

4.
朱燕燕 《科技信息》2011,(15):143-143,387
针对关联规则挖掘中Apriori算法的不足,提出了一种改进算法。该算法使用完美哈希函数,优化的事务压缩技术,分组查询计数和直接产生候选项集的技术来挖掘频繁项集,从而提高了算法效率。最后,通过对两种算法进行性能比较,验证了改进算法的优越性。  相似文献   

5.
一种基于分类的关联规则Apriori算法   总被引:2,自引:0,他引:2  
关联规则的Apriori算法,在频繁项集的过程中要多次扫描数据库,而事务数据库中含有较多的冗余数据,极大地影响了频繁项集的提取效率。针对这些问题,提出一种基于分类的Apriori算法,在频繁项集提取以前,用分类的方法去掉无关冗余数据。实验结果表明这种方法较好地提高了Apriori算法的性能,在实践中有一定的应用价值。  相似文献   

6.
基于线性链表存储结构的Apriori改进算法   总被引:1,自引:1,他引:0  
Apriori是最有影响的挖掘关联规则频繁项集的算法。但是Apiori由于需要多次对数据库进行扫描,所以运行效率比较低。在Apriori算法的基础上,本文提出了一种基于线性链表的频繁项集挖掘算法,实验证明该算法能够有效提高执行效率。  相似文献   

7.
在Apriori算法中,需要多次扫描数据库,并且对候选集的支持度计算比较繁琐,本文利用等价关系的概念,在信息表上计算候选集的支持度计数并寻找频繁项集,且只需扫描数据库1次,提高了挖掘效率,同时保留了包含频繁项集的事务.  相似文献   

8.
在所有频繁项集挖掘算法中,Apriori算法一直是一个经典的算法,但是该算法存在的最大缺陷是要进行多次的数据库扫描并且在挖掘过程中产生大量的候选频繁项集,因此效率很低.提出了利用基于矩阵的方法挖掘频繁项集,很好地避免了这个缺陷.  相似文献   

9.
在众多的关联规则挖掘算法中,Apriori算法是最为经典的一个,但Apriori算法有以下缺陷:需要扫描多次数据库、生成大量候选集以及迭代求解频繁项集。因而提出了一种新方法,使Apriori算法产生的候选项集再通过数据库查找是否为频繁项集,从而提高算法的效率。最后针对入侵检测系统形成关联规则。实验结果表明,改进后的算法...  相似文献   

10.
发现频繁项集是关联规则挖掘的关键步骤。然而,大多数频繁项集求解算法因需要产生大量候选集而降低了效率。该文在研究概念格和频繁项集关系的基础上,将剪枝概念格PCL模型引入数据库中频繁项集的表示,利用概念间的关系性质,在不丢失信息的同时能有效压缩频繁项集的规模,并提出基于PCL模型的频繁项集求解算法。该算法基于Apriori性质,在构造过程中及时、动态地剪枝,删除与频繁项集求解无关的概念,从而有效地改善了频集挖掘算法的时空性能;实验证实了算法良好的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号