首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于事务线索树的一次扫描关联规则增量挖掘算法
引用本文:业宁,董逸生,王厚立.基于事务线索树的一次扫描关联规则增量挖掘算法[J].应用科学学报,2004,22(2):200-204.
作者姓名:业宁  董逸生  王厚立
作者单位:1. 东南大学,计算机科学与工程系,江苏,南京,210096;南京林业大学,计算机系,江苏,南京,210037
2. 东南大学,计算机科学与工程系,江苏,南京,210096
3. 南京林业大学,计算机系,江苏,南京,210037
基金项目:国家自然科学基金(30271048),江苏省九五重点攻关课题(BJ98017-1),江苏省十五高科技(BJ2001013),校科研基金重点课题(X02-070-1(Z))资助项目
摘    要:首先将事务数据库压缩存储到一棵事务线索树(TT-tree)的结点上,并建立这些结点的索引表,然后寻找结点索引表的最后结点到根结点的全部路径,这些路径及路径的交集包含了用于挖掘关联规则的频繁集,该算法只需扫描事务数据库一次,由于采用了逆向搜索TT-tree的方法,搜索的时间开销非常少,该算法可以挖掘中短模式的海量数据,具有很好的伸缩性,同时该算法具有增量挖掘的功能,通过大量的实验数据进行比较。该算法的速度约是Apriori算法的10倍。

关 键 词:事务线索树  一次扫描关联规则  增量挖掘算法  可伸缩性  频繁集  事务数据库
文章编号:0255-8297(2004)02-0200-05

The One-Time Scanning Incremental Mining Algorithm of Association Rules Based on a Transaction Thread Tree
YE Ning.The One-Time Scanning Incremental Mining Algorithm of Association Rules Based on a Transaction Thread Tree[J].Journal of Applied Sciences,2004,22(2):200-204.
Authors:YE Ning
Abstract:A novel incremental mining algorithm of association rules is presented in this paper. First, transaction database is compressed and stored in a transaction thread tree (TT-tree). Then the index table of the nodes is established. Finally, all paths from leaf node to root node are obtained with the reverse search method. The frequent sets are included in these paths. The algorithm is very efficient since it scans transaction database only one time. In addition to efficiency, our algorithm is both scalable and incremental. The experimental results show that our algorithm is 10 times faster than that of the Apriori method.
Keywords:frequency set  transaction thread tree(TT-tree)  incremental  scalability
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号