期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

吴志丹赵大宇唐恒永《沈阳师范大学学报(自然科学版)》2006,24(3):257-259

从大型事务数据库中发现关联规则是数据挖掘中的一个重要课题,其核心问题是挖掘频繁项集.经典Apriori算法是有效的挖掘频繁项目集的算法.在分析Apriori算法的基础上,提出了一种利用二维数组来代替算法中的哈希树的方法,可以迅速产生二阶频繁项目集,改善了Apriori算法的效率瓶颈,大大提高了算法的执行效率. 相似文献

2.

基于Hash表的改进Apriori算法

《广州大学学报(自然科学版)》2018,(6)

Apriori算法是一种经典的关联分析挖掘算法.经典Apriori算法计算效率偏低,并且需要多次扫描数据库.针对这些问题,文章提出了基于Hash表改进的Apriori算法.基于Hash表的改进Apriori算法计算时只需扫描对应频繁项集Hash表中对应的项,缩小了扫描范围,并且只需要扫描一次数据库.对比经典的Apriori算法,性能具有显著提高. 相似文献

3.

I-Apriori：一种基于Spark平台的改进Apriori算法

李庆鹏《科学技术与工程》2017,17(27)

针对Apriori算法在第二次迭代过程中产生大量候选集的弊端,在Spark大数据框架下,将Apriori算法进行并行化处理。提出一种基于Spark平台的改进Apriori算法——I-Apriori;该算法利用Spark基于内存计算的抽象对象(RDD)存储频繁项集,在第二次迭代中,通过使用改进的布隆过滤器存储频繁1项集,消除候选集生成,减少数据库扫描次数,提高算法效率。实验结果表明,相比基于Spark平台的Apriori算法进行性能评估,I-Apriori算法具有更优的性能,能够较大程度地提高大数据关联规则挖掘的效率。相似文献

4.

一种改进的Apriori算法的研究

朱燕燕《科技信息》2011,(15):143-143,387

针对关联规则挖掘中Apriori算法的不足,提出了一种改进算法。该算法使用完美哈希函数,优化的事务压缩技术,分组查询计数和直接产生候选项集的技术来挖掘频繁项集,从而提高了算法效率。最后,通过对两种算法进行性能比较,验证了改进算法的优越性。相似文献

5.

一种基于分类的关联规则Apriori算法 总被引：2，自引：0，他引：2

李国志王洪春李世全《江南大学学报(自然科学版)》2009,8(5):535-538

关联规则的Apriori算法,在频繁项集的过程中要多次扫描数据库,而事务数据库中含有较多的冗余数据,极大地影响了频繁项集的提取效率。针对这些问题,提出一种基于分类的Apriori算法,在频繁项集提取以前,用分类的方法去掉无关冗余数据。实验结果表明这种方法较好地提高了Apriori算法的性能,在实践中有一定的应用价值。相似文献

6.

基于线性链表存储结构的Apriori改进算法 总被引：1，自引：1，他引：0

赵明茹《科学技术与工程》2011,11(23)

Apriori是最有影响的挖掘关联规则频繁项集的算法。但是Apiori由于需要多次对数据库进行扫描,所以运行效率比较低。在Apriori算法的基础上,本文提出了一种基于线性链表的频繁项集挖掘算法,实验证明该算法能够有效提高执行效率。相似文献

7.

一种基于信息表的关联规则挖掘方法

汪际和陈平王新《云南民族大学学报(自然科学版)》2010,19(6)

在Apriori算法中,需要多次扫描数据库,并且对候选集的支持度计算比较繁琐,本文利用等价关系的概念,在信息表上计算候选集的支持度计数并寻找频繁项集,且只需扫描数据库1次,提高了挖掘效率,同时保留了包含频繁项集的事务. 相似文献

8.

基于矩阵的频繁项集挖掘算法

杨景郑钟志宋金歌段鹏《云南民族大学学报(自然科学版)》2010,19(5)

在所有频繁项集挖掘算法中,Apriori算法一直是一个经典的算法,但是该算法存在的最大缺陷是要进行多次的数据库扫描并且在挖掘过程中产生大量的候选频繁项集,因此效率很低.提出了利用基于矩阵的方法挖掘频繁项集,很好地避免了这个缺陷. 相似文献

9.

基于数据挖掘关联规则Apriori改进算法的入侵检测系统的研究 总被引：1，自引：1，他引：0

张浩景凤宣谢晓尧《贵州师范大学学报(自然科学版)》2011,29(3):84-87

在众多的关联规则挖掘算法中,Apriori算法是最为经典的一个,但Apriori算法有以下缺陷：需要扫描多次数据库、生成大量候选集以及迭代求解频繁项集。因而提出了一种新方法,使Apriori算法产生的候选项集再通过数据库查找是否为频繁项集,从而提高算法的效率。最后针对入侵检测系统形成关联规则。实验结果表明,改进后的算法... 相似文献

10.

基于剪枝概念格模型的频繁项集表示及挖掘

胡学钢刘卫王德兴《合肥工业大学学报(自然科学版)》2007,30(9):1095-1098

发现频繁项集是关联规则挖掘的关键步骤。然而,大多数频繁项集求解算法因需要产生大量候选集而降低了效率。该文在研究概念格和频繁项集关系的基础上,将剪枝概念格PCL模型引入数据库中频繁项集的表示,利用概念间的关系性质,在不丢失信息的同时能有效压缩频繁项集的规模,并提出基于PCL模型的频繁项集求解算法。该算法基于Apriori性质,在构造过程中及时、动态地剪枝,删除与频繁项集求解无关的概念,从而有效地改善了频集挖掘算法的时空性能;实验证实了算法良好的性能。相似文献