首页 | 本学科首页   官方微博 | 高级检索  
     

稀疏数据立方的一种快速计算方法
引用本文:胡凌燕,程恳,陈长清. 稀疏数据立方的一种快速计算方法[J]. 江汉大学学报(自然科学版), 2003, 31(1): 55-58
作者姓名:胡凌燕  程恳  陈长清
作者单位:江汉大学数学与计算机科学学院,湖北,武汉,430056;江汉大学数学与计算机科学学院,湖北,武汉,430056;江汉大学数学与计算机科学学院,湖北,武汉,430056
基金项目:科技部科技电子政务系统关键技术及应用系统研究项目(项目编号 2001BA110B01)
摘    要:提出了一种新的稀疏数据立方计算方法CFD(Computation by Functional Dependencies),它采用自底向上的顺序划分数据立方的各个维,同时按自顶向下的顺序计算聚集,从而充分利用了数据立方的各个group-by之间的共性。CFD和以前所有的立方计算方法不同:一是既能避免计算冰山数据立方中不满足最小支持度的grorp-by,同时也利用了聚集函数的特征来加速聚集计算;二是利用维之间的依赖关系能有效减少划分时间。实验表明,和以前的算法相比CFD的性能明显提高。

关 键 词:稀疏数据立方    函数依赖  快速计算方法
文章编号:1009-1777(2003)01-0055-04
修稿时间:2002-09-03

A Kind of Fast Calculating Method of Sparse Data Cube
HU Ling-yan. A Kind of Fast Calculating Method of Sparse Data Cube[J]. Journal of Jianghan University(Natural Sciences), 2003, 31(1): 55-58
Authors:HU Ling-yan
Abstract:This paper presents a new algorithm CFD to compute a data cube. CFD partitions the dimensions of a data cube from bottom to up, at the same time it computes the aggregate value from top to bottom. CFD is different from all methods proposed earlier. First CFD avoids computing the group-bys that do not meet minimum support and at the same time use the property of aggregate function. Second is using the dependencies between dimensions to efficiently reduce the time of partition. The experiments have shown that the performance of CFD has a significant improvement.
Keywords:sparse data cube  dimension  functional dependency  rapid calculating method
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号