基于MapReduce的数据流频繁项集挖掘算法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于MapReduce的数据流频繁项集挖掘算法

作者姓名：	朱付保白庆春汤萌萌朱颢东

作者单位：	郑州轻工业学院计算机与通信工程学院, 郑州 450002

摘要：	针对传统数据流频繁项集计算中效率低、内存消耗大等问题,本文采用并行计算的思想设计了一种基于MapReduce的数据流频繁项集挖掘算法,首先,对进行数据分块压缩和传输,其次,将数据频繁项的计算分布在负载均衡的数据节点,可以有效保证数据的执行效率.最后通过一次调度处理合并各个节点产生的频繁项集并进行合并.理论分析和实验对比结果均表明,该算法对于并行处理数据流频繁项集的统计问题是有效可行的.
关键词：	MapReduce 频繁项集数据流并行计算数据挖掘
收稿时间：	2017-07-07
本文献已被 CNKI 等数据库收录！
	点击此处可从《华中师范大学学报(自然科学版)》浏览原始摘要信息
	点击此处可从《华中师范大学学报(自然科学版)》下载全文