首页 | 本学科首页   官方微博 | 高级检索  
     检索      

频繁序列模式挖掘算法
引用本文:管恩政,周春光,王喆,徐秀娟.频繁序列模式挖掘算法[J].吉林大学学报(信息科学版),2005,23(3):267-272.
作者姓名:管恩政  周春光  王喆  徐秀娟
作者单位:吉林大学计算机科学与技术学院,长春,130012;吉林大学计算机科学与技术学院,长春,130012;吉林大学计算机科学与技术学院,长春,130012;吉林大学计算机科学与技术学院,长春,130012
基金项目:国家自然科学基金 , 教育部科学技术基金
摘    要:为解决从数据库中挖掘长模式和支持度较低时可能遇到计算复杂度较高的问题,提出一种新的算法--EFSPAN(Effective Frequent Sequential PAtterN mining algorithm).算法采用了深度优先挖掘策略,并将基于前缀序列格的深度优先遍历与两种高效的剪枝策略相结合.实验结果表明:新算法在模式较长和支持度较低时,能使搜索空间中60%以上的节点免被搜索;从而大大缩小了搜索空间,降低了序列模式挖掘算法的计算复杂度.

关 键 词:频繁模式  序列模式  数据挖掘  深度优先  长模式
文章编号:1671-5896(2005)03-0267-06
修稿时间:2004年5月26日

Frequent Sequential Pattern Mining Algorithm
GUAN En-zheng,ZHOU Chun-guang,WANG Zhe,XU Xiu-juan.Frequent Sequential Pattern Mining Algorithm[J].Journal of Jilin University:Information Sci Ed,2005,23(3):267-272.
Authors:GUAN En-zheng  ZHOU Chun-guang  WANG Zhe  XU Xiu-juan
Abstract:A novel algorithm EFSPAN(Effective Frequent Sequential PAtterN mining algorithm)is introduced to solve the problem. When sequential patterns are long and the minimum support becomes low, the computational complexity of such algorithms may become very expensive. The search strategy of our algorithm integrates a depth-first traversal of the prefix sequence lattice with two effective pruning mechanisms. Experiments show that EFSPAN can avoid searching more than 60% of nodes in the search space when patterns are long and minimum support is low, which minimizes the search space greatly and decreases the high computational complexity.
Keywords:frequent pattern  sequence pattern  data mining  depth-first  long pattern
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号