首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于模式增长的频繁模式挖掘算法
引用本文:侯俊杰,李春平.一种基于模式增长的频繁模式挖掘算法[J].华中科技大学学报(自然科学版),2005,33(Z1):272-274.
作者姓名:侯俊杰  李春平
作者单位:清华大学,软件学院,北京,100084
摘    要:提出了一种基于模式增长的频繁模式挖掘算法(简称为PGMiner算法).这种算法是一种深度挖掘的算法,不产生任选项集,便于发现较长的模式,避免了Apriori和FP-growth方法存在的问题.通过一种简单的索引结构在映射数据库中不断地增加模式长度.这种索引结构占用较少的内存,使得这种基于内存的算法有很高的执行效率.采用现实数据集以及IBM人工数据集对PGMiner算法进行测试.试验结果显示,对于一般类型的特别是较为稀疏的数据集,PGMiner算法比Apriori和FP-growth方法有更好的性能.

关 键 词:频繁模式  模式增长  映射数据库  分治策略
文章编号:1671-4512(2005)S1-0272-03
修稿时间:2005年8月15日

A pattern growth algorithm for frequent patterns mining
Hou Junjie,Li Chunping.A pattern growth algorithm for frequent patterns mining[J].JOURNAL OF HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY.NATURE SCIENCE,2005,33(Z1):272-274.
Authors:Hou Junjie  Li Chunping
Institution:Hou Junjie Li Chunping Postgraduate,School of Software,Tsinghua University,Beijing 100084,China.
Abstract:A pattern growth algorithm for frequent patterns mining(called PGMiner algorithm) is presented.An indexing structure is adopted to grow the pattern length in a projected database,which may reduce the CPU time and save the memory consuming.The algorithm presedted in this paper is tested versus other algorithms on real world datasets and IBM artificial datasets.The empirical results illustrate that the PGMiner algorithm performs better than Apriori and FP-growth method when processing sparse data datasets that may contain long patterns.
Keywords:frequent pattern  pattern growth  projected database  divide-and-conquer
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号