首页 | 本学科首页   官方微博 | 高级检索  
     检索      

NB-MAFIA:基于N-List的最长频繁项集挖掘算法
引用本文:沈戈晖,刘沛东,邓志鸿.NB-MAFIA:基于N-List的最长频繁项集挖掘算法[J].北京大学学报(自然科学版),2016,52(2):199-209.
作者姓名:沈戈晖  刘沛东  邓志鸿
作者单位:北京大学信息科学技术学院计算机科学技术系,北京,100871;北京大学信息科学技术学院智能科学系,北京100871;北京大学机器感知与智能教育部重点实验室,北京100871
基金项目:国家自然科学基金(61170091),863计划(2015AA015403)
摘    要:本文在深度优先搜索的框架上,引入基于项集前缀树节点链表的项集表示方法 N-List,提出一个高效的最长频繁项集挖掘算法NB-MAFIA。N-List的高压缩率和高效的求交集方法可以实现项集支持度的快速计算,同时采用对搜索空间的剪枝策略和超集检测策略来提高算法效率。在多个真实和仿真数据集上,通过实验评估了NB-MAFIA和两个经典算法。实验结果表明NB-MAFIA在多数情况下优于其他算法,尤其在真实和稠密数据集上优势更为明显。

关 键 词:数据挖掘  频繁项集挖掘  最长项集  N-List  算法

NB-MAFIA: An N-List Based Maximal Frequent Itemset Algorithm
SHEN Gehui,LIU Peidong,DENG Zhihong.NB-MAFIA: An N-List Based Maximal Frequent Itemset Algorithm[J].Acta Scientiarum Naturalium Universitatis Pekinensis,2016,52(2):199-209.
Authors:SHEN Gehui  LIU Peidong  DENG Zhihong
Abstract:
Keywords:data mining  frequent itemset mining  maximal itemset  N-List  algorithm
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号