首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 312 毫秒
1.
针对维层次的特点,提出一种利用基表元组的标识维来对Data Cube来进行压缩存储(Hierarchical Compress Storage Cube,HCSCube)的方法。在定义基表元组与Data Cube中聚集元组的导出关系后,DataCube中的一些聚集元组的聚集值可以由基表元组导出关系得到,因而可以合并保存,从而实现了Data Cube的压缩存储。理论分析和实验表明,基于维层次的压缩存储方法不仅能显著的减小Data Cube的存储空间,而且在查询效率上也有改进。  相似文献   

2.
提出利用Cube中的维层次来创建高性能的DH_Cube(dimension hierarchy cube),在DH_Cube中存储构成Cube的所有维的所有层次粒度组成的数据单元,从而实现了在1个DH_Cube中就可以存储构成该Cube的d个维所创建的2^d个立方体视图的所有信息,从而压缩Cube存储空间,提高MOLAP查询效率,减少Cube创建时间和更新时间.  相似文献   

3.
根据Data Cube模式中维的层次性,提出了层次式B^+树及维层次编码的概念,并应用于层次树形Cube(HT Cube)方法中.HT Cube将维划分为聚集维与分析维,在分析维上利用层次式B^+树除去了冗余数据,并在查询过程中形成维层次编码,在聚集维上则利用维层次编码组合而成的分析维编码进行索引,从而可以高效地检索到聚集值.理论分析和实验证明,该方法不但节省了存储空间,而且可利用层次信息高效地进行各种OLAP查询,为Data Cube模式更新、OLAP查询导航和OLAP查询行为分析的实现提供了可能.  相似文献   

4.
针对复杂生态信息的存储与管理问题,提出一种基于B 树的多维层次聚集立方体存储结构模型。通过将d维数据空间构建成多维层次式B 树,并节点进行压缩的二进制维层次编码,在此基础上实现了模型的快速查询、数据更新与模式更新算法。与传统的Data Cube相比,MH-Cube具有较好的查询与更新功能。生态数值实验表明,模型可为复杂生态信息的存储与管理提供较好的解决方案。  相似文献   

5.
传统的Cube计算算法对具有复杂维层次结构的多维数据集合实施Cube操作时,存在明显的不足.提出了基于商空间理论层次Cube操作的聚集算法.结果表明,其在性能测试中较传统的算法在计算效率方面有了显著的提高.  相似文献   

6.
研究了Data Cube的索引技术,提出一种能够处理复杂维层次结构情况的维层次编码.维层次编码充分利用了Data Cube中维的层次性及其语义特性,结合二进制编码与维层次结构编码对维成员值进行编码,通过二进制操作,可以快速检索出与查询关键字相匹配的维层次编码.同时,基于维层次编码定义的层次链掩码,层次掩码及检索函数能够充分利用多维数据中的语义信息,实现基于语义的检索,减少了I/O开销,提高了OLAP查询效率.  相似文献   

7.
为解决传统行存储结构导致OLAP聚集计算效率低下的问题,设计了基于维存储的OLAP数据存取技术.首先,将OLAP事实表中的维属性集和度量属性集定义为2个列族,每张维表的所有属性定义为1个列族.对维表进行二进制编码,生成维层次编码,从而保持了维的层次语义特性.以(维层次编码,度量值)对形式按列组织数据,消除查询时维表与事实表的复杂连接操作运算.然后,采用自底向上方法构建B+树,对维层次编码进行索引,加快了数据读取效率.通过增删事实表和维层次编码-度量表中相应的列,实现维和度量的增加和删除.性能分析结果表明,这种OLAP数据存取技术具有良好的可扩展性,能高效地管理和存取OLAP海量多维数据,有效支持上层OLAP聚集计算.  相似文献   

8.
在大量数据仓库系统中,对于一个d维的data cube, 数据立方体(cube)可以生成2d个聚集cuboids, 然而随着数据仓库维数的增长,计算这些预聚集数据已经成为一个瓶颈.在minimal cubing方法的基础上,提出一种具体层次语义特性的多维层次数据立方体--前缀索引立方体(prefix-index cubing)技术,将高维cube划分成若干个低维立方体cube, 以实现高维cube的分布式存储和并行计算.理论分析与实验结果表明,相对于以往的minimal cubing等方法, 前缀索引立方体方法的性能显著提高.  相似文献   

9.
对高维样品点的降维是多元统计分析中一项重要的内容,在研究多指标样品的聚集、分带和对比中有着非常广泛的用途.本文借极点的几何模型引出一种简单的降维方法,把高维的样品点投影到二维或三维空间中,并保持原样点之间的相似关系,以便我们能在二维平面上直观地看到高维点的聚集分布情况.  相似文献   

10.
针对传统短距离作用势中链表存储数据结构所导致的非规则数据访问问题,提出了块-单元紧凑存储数据结构的解决方法.设计并实现了一个集成以上数据结构、基于实测的高维动态负载平衡方法的短距离作用势分子动力学并行软件.该软件已应用于高温高压微喷射模拟和液晶相模拟两个领域,可以在几百个处理机上模拟包含1×106~1×108个粒子的二维和三维问题,其中程序的并行效率在80%以上.与传统存储数据结构方法相比,本方法提高执行性能5%,其性能约为所用处理机峰值性能的15%以上.  相似文献   

11.
数据立方体在许多多维数据的数据仓库的高速OLAP操作中扮演着重要的角色. 但在许多高维的数据仓库的应用中,查询分析效率是个关键的问题.例如超过100维,大约106个元组.在这样高维情况下建立全物化数据立方体来减少分析时间是不可行的.利用最小方的方法可以在高维数据集上进行有效OLAP操作的方法.如果能根据查询分析的历史记录合理地为立方体的维分片,就能在相同空间复杂度的情况下提高OLAP操作的效率.  相似文献   

12.
基于OLAP查询的数据集市系统的研究   总被引:3,自引:0,他引:3  
研究了通过对数据仓库视图进行水平分割来建立数据集市系统,提高OLAP查询效率的方法和技术。提出了根据OLAP查询中的选择谓词构造其最小项谓词,选择数据仓库立方体视图进行水平分割,利用视图分割后的裂片建立的数据集市来回答查询,达到减少访问的视图元组数和加快查询响应时间,从而提高OLAP查询效率,削减维护费用。  相似文献   

13.
数据仓库在决策支持系统中的应用   总被引:7,自引:1,他引:7  
综合应用数据仓库技术与联机分析处理技术开发了外资管理决策支持系统,提出了该数据仓库系统的实现方案和架构,并阐述了实现前台分析应用与OLAP服务集成的关键技术,即如何访问数据立方体中多维数据和如何管理元数据以控制OLAP服务,另外,从效率和灵活性两个角度给出了基于数据库和基本数据仓库分析的性能比较。  相似文献   

14.
在线联机分析处理(OLAP)是一个分析商业信息趋势的重要工具。虽然OLAP用多维立方体模型来分析结构化的商业数据是理想的,但是它并不适合用来表现和分析复杂的半结构化数据,如:XML文档。因为在广泛的应用领域,XML都是表现数据的语言选择,所以分析XML文档是必需的和紧迫的。描述了一个用XML树模型来分析XML文档的想法。鉴于OLAP的多维聚合操作不能够表示XML文档上的、结构复杂的分析操作,提出了新的、扩展了的XQUERY来支持这种复杂的分析操作。  相似文献   

15.
由于任何浏览Web站点的访问者都可以通过HTTPS使用联机分析处理(OLAP)数据源,因此,访问者的安全凭据是必需的.针对OLAP的安全访问,提出层次化设计方案,通过给出分组实例程序,阐述运用网上办公组件(Office Web Component,OWC)中的自行定制分组功能,使各个级别的分析用户只能访问与自己相关的数据,屏蔽与分析用户不相关的数据源.对OWC组件的安全漏洞的威胁提出预防措施,从而提高基于Web的OLAP访问的安全性.  相似文献   

16.
赵杰 《科学技术与工程》2013,13(26):7851-7855
利用OLAP进行大规模监测数据查询时存在效率低和实时性差的问题,传统解决方法主要利用缩小数据集市数据的方法,虽然在一定程度上提高了查询效率,但是会出现丢失数据的现象。提出在基于聚类方法基础之上进行层次序列OLAP查询优化,并针对大规模海洋监测数据的特点提出OLAPCache多级查询方法。在该算法中,首先分析OLAP序列立方体的查询效率问题;其次以等价类的层次关系为基础,确定等价的上下界和聚类值;然后利用改进的各级查询层次的运算策略来判断OLAP查询的语义特性,提高其Cache性能;最后结合OLAP查询集的闭包中存在最小蕴含关系的特点,对OLAP查询的蕴含关系进行分组查找。通过大规模监测的海洋数据对该算法进行仿真验证,仿真表明,该算法有效地避免了对大规模海量数据的递归查询,具有较好的执行效率。  相似文献   

17.
基于操作序列挖掘的OLAP查询推荐方法   总被引:1,自引:0,他引:1  
针对联机分析处理(OLAP)操作复杂导致的用户使用效率低下问题,提出基于操作序列挖掘的OLAP查询推荐方法.首先从多维表达式(MDX)查询语句记录中提取整数数列形式的查询序列,再利用PrefixSpan方法对查询序列进行频繁序列模式挖掘,并基于挖掘出的模式及其子模式建立概率矩阵,最后通过搜索与用户当前查询操作或查询序列...  相似文献   

18.
OLAP与数据挖掘工具由于内在技术以及适用范围的不同,在决策分析中必须协调使用才能发挥最佳的作用。本文提出基于Agent的OLAM(OLAP Mining)模型,将数据挖掘和OLAP技术结合在一个统一的框架之中。提出广义数据空间的概念,使得数据挖掘能够在数据库或数据仓库的不同部位或不同的抽象级别上,对数字数据或者文本数据进行挖掘,加强了决策分析的功能和灵活性。最后,把基于Agent的OLAM模型应用于构建智能CRM,此模型把Agent本身的特点自然地引入到数据挖掘过程中,使数据挖掘系统具有了自治性、自动反应性、交互性、适应环境性等智能特点,有助于在大型数据库和数据仓库中交互式地挖掘多层次多维的知识和联系。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号