I-Apriori：一种基于Spark平台的改进Apriori算法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

I-Apriori：一种基于Spark平台的改进Apriori算法

作者姓名：	李庆鹏

作者单位：	武警工程大学

摘要：	针对Apriori算法在第二次迭代过程中产生大量候选集的弊端,在Spark大数据框架下,将Apriori算法进行并行化处理。提出一种基于Spark平台的改进Apriori算法——I-Apriori;该算法利用Spark基于内存计算的抽象对象(RDD)存储频繁项集,在第二次迭代中,通过使用改进的布隆过滤器存储频繁1项集,消除候选集生成,减少数据库扫描次数,提高算法效率。实验结果表明,相比基于Spark平台的Apriori算法进行性能评估,I-Apriori算法具有更优的性能,能够较大程度地提高大数据关联规则挖掘的效率。
关键词：	内存计算框架数据挖掘关联规则算法布隆过滤器
收稿时间：	2017-03-01
修稿时间：	2017-03-01
本文献已被 CNKI 等数据库收录！
	点击此处可从《科学技术与工程》浏览原始摘要信息
	点击此处可从《科学技术与工程》下载免费的PDF全文