首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于动态排序的最大频繁项集挖掘算法
引用本文:汪成亮,罗昌银.一种基于动态排序的最大频繁项集挖掘算法[J].世界科技研究与发展,2010,32(4):440-444.
作者姓名:汪成亮  罗昌银
作者单位:[1]重庆大学计算机学院,重庆400044 [2]重庆大学电气工程学院,重庆400044
摘    要:集合枚举树是最大频繁项集挖据算法中常采用的数据结构。在此算法中,最大频繁项集的挖掘过程也可以看作对集合枚举树的搜索过程。为缩小对集合枚举树的搜索空间,本文提出了一种新颖而高效的剪枝方法:根据已挖掘得到的最大频繁模式动态排列枚举树节点的顺序,最大限度的施行剪枝,从而缩小搜索空间。该算法采用位图的数据格式与深度优先的搜索策略。实验结果表明,该算法能有效提高最大频繁项集的挖掘效率,在采用相同的测试数据情况下,效率优于FPMax。

关 键 词:数据挖据  最大频繁项集  集合枚举树  动态排序

A Maximal Frequent Itemsets Mining Algorithm Based on Dynamic Reordering
WANG Chengliang,LUO Changyin.A Maximal Frequent Itemsets Mining Algorithm Based on Dynamic Reordering[J].World Sci-tech R & D,2010,32(4):440-444.
Authors:WANG Chengliang  LUO Changyin
Institution:1. College of Computer Science,Chongqing University, Chongqing 400044; 2. College of Electrical Engineering, Chongqing University, Chongqing 400044 )
Abstract:Set Enumeration Tree(SET) is a common data structure in maximal frequent itemsets(MFI) mining algorithm. For this kind of algorithm, the process of mining MFI is a searching process. To reduce the search space of SET,a novel and effective pruning method, MPDR algorithm, in which SET node is max-patterned reordered dynamically, is introduced. Bitmap data format and depth-first search strategy are adopted by this algorithm. Experiments indicate that this algorithm accelerates the generation of maximal frequent itemsets obviously. Using the same testing data sets, our new approach outperforms the FPMax algorithm.
Keywords:data mining  maximal frequent itemsets  set enumeration tree  dynamic reordering
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号