首页 | 本学科首页   官方微博 | 高级检索  
     

流数据频繁项算法研究
引用本文:罗超,李义杰,罗丹. 流数据频繁项算法研究[J]. 辽宁工程技术大学学报(自然科学版), 2004, 23(Z1): 57-59
作者姓名:罗超  李义杰  罗丹
作者单位:辽宁工程技术大学,电子与信息工程系,辽宁,阜新,123000
摘    要:流数据频繁项挖掘是一项重要的研究课题,是其他流数据挖掘任务的基础。Lossy counting 算法是第一个近似的流数据频繁项挖掘的算法,并且具有空间和时间的高效性。详细分析该算法,尤其是它不能回答关于时间的查询的不足后,对其进行改进,提出了一个在多时间粒度上挖掘流数据频繁项的设想,加入时间维度。改进后的算法在时间倾斜窗口保存与合并频繁项,可以应用于各种对时间敏感的流数据查询和挖掘应用中。

关 键 词:数据挖掘  流数据挖掘  频繁项  频繁项挖掘
文章编号:1008-0562(2004)增刊-0057-03
修稿时间:2004-05-18

Research on arithmetic frequent datasets over data stream
LUO Chao,LI Yi-jie,LUO Dan. Research on arithmetic frequent datasets over data stream[J]. Journal of Liaoning Technical University (Natural Science Edition), 2004, 23(Z1): 57-59
Authors:LUO Chao  LI Yi-jie  LUO Dan
Abstract:Mining frequent items over data stream is an important problem of research,which is the foundation of several other researches.Lossy counting algorithm is the fast algorithm proposed to solve the problem of mining frequent item sets over data stream,and it is efficient about space and time.We analyze this algorithm, especially that can not answer the query about the time,and modify it,and present a proposal for mining time-sensitive item sets by incorporating time dimension.Then we can contain and add frequency item sets to the frame of logrithmal tilted-time window to do the time-sensitive query and mining.
Keywords:data mining  data stream mining  frequent item set  frequent item set mining
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号