首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于预裁剪的不确定数据流频繁项集挖掘算法
引用本文:马力.一种基于预裁剪的不确定数据流频繁项集挖掘算法[J].科学技术与工程,2016,16(23).
作者姓名:马力
作者单位:中国石油大学(华东)计算机与通信工程学院
基金项目:中央高校基本科研业务费专项资金资助(14CX02032A)
摘    要:随着交通、网络流量监控等应用的涌现,不确定数据流频繁项集挖掘成为近年来的研究热点。通常在不确定数据流中,频繁项集所占的比例较小,导致挖掘中无效操作较多。基于这种情况,提出了一种基于预裁剪的不确定数据流频繁项集挖掘算法Prep-UF-Streaming;该算法,不仅能裁剪掉大部分非频繁项集,提高了算法的平均运行时间;而且能够检测到非频繁项集成为频繁项集的可能性,尽量不丢失频繁项集,从而尽可能地提高算法的性能。

关 键 词:不确定数据流    频繁项集    滑动窗口
收稿时间:4/6/2016 12:00:00 AM
修稿时间:5/7/2016 12:00:00 AM

An Algorithm of Frequent Itemset Mining over Uncertain Data Streams based on Pre-pruning
Ma Li.An Algorithm of Frequent Itemset Mining over Uncertain Data Streams based on Pre-pruning[J].Science Technology and Engineering,2016,16(23).
Authors:Ma Li
Abstract:With the emergence of applications such as traffic, network traffic monitoring, frequent itemset mining over uncertain data streams becomes hotspot in recent years. Usually the percentage of frequent itemset in the uncertain data streams is relatively small. Based on this, we proposed an algorithm of frequent itemset mining over uncertain data streams based on pre-pruning named Prep-UF-Streaming. This algorithm not only prunes most of the non-frequent itemset and increases the average running time, but also can detect the possibility of non-frequent become frequent itemset, and try not to lose frequent itemset, thus as far as possible to improve its efficiency.
Keywords:uncertain data streams  frequent itemset  sliding window
本文献已被 CNKI 等数据库收录!
点击此处可从《科学技术与工程》浏览原始摘要信息
点击此处可从《科学技术与工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号