首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
ETL是指数据抽取(extract)、转换(transform)、装载(load)的过程,是数据仓库构建过程中的核心环节和技术难点.基于水厂数据仓库系统,研究了如何运用ETL技术实现水厂数据仓库中数据的抽取、转换和装载.  相似文献   

2.
李宝林 《江西科学》2010,28(6):844-848
ETL是构建数据仓库的一个非常重要的环节,是整个数据仓库系统乃至整个决策支持系统的基石。如何设计高效的ETL过程成为众多计划或正在实施数据仓库项目的单位考虑的重要问题。针对数据来源一是Oracle数据库,二是Excel格式的经济普查电子年鉴系统的异构性,提出了一种并行数据抽取接口设计方案,解决了异构数据源的模式匹配问题,对数据进行清理、集成和变换后,整合两种异构数据源为统一的Oracle数据存储模式,消除了异构数据源之间的隔离,保证了对数据资源的有效集成。提出在数据源和数据仓库之间增加一个中间层ODS(操作型数据存储),通过在ODS中的转换策略研究,论述了如何实现个性化的数据转换,将信息仓库中的数据以多维的形式表示,满足各种方式的个性化查询。  相似文献   

3.
浅谈数据仓库中ETL的重要性   总被引:1,自引:0,他引:1  
张蓓  赵莉 《科技信息》2008,(18):82-82
ETL是数据仓库的重要环节,本文主要论述了ETL在数据仓库中的作用,以及通过对数据仓库概念、搭建数据仓库的难点、ETL在数据仓库中的位置和其实现过程的介绍论证了ETL在数据仓库中的重要性。  相似文献   

4.
ETL 工具从异构数据泺抽取数据,并将数据清洗,规范化后装载到数据仓库.文章从前期的数据理解阶段入手,分别讨论了数据的抽取、清洗转换、装载等不同阶段需要考虑的设计问题及相应的解决方案.提出了以数据理解为根基,以清洗转换为中心的设计思想,并给出成绩管理模块的具体实施步骤.  相似文献   

5.
天津港信息化建设随着应用规模的扩大、应用要求的提高、应用层次的加深、应用环境的复杂化和开放化,现行的应用系统已暴露出数据利用率低、分析能力不够等局限性。基于此,天津港提出构建”天津港数据集成与辅助决策系统”项目,消除现有系统的局限性。提高企业的管理水平和竞争能力。  相似文献   

6.
数据质量是商业智能的基础,数据质量的好坏直接影响到商业智能的成败.数据质量存在问题有多方面的原因,在此基础上提出了实施数据清洗的五个步骤,最后阐述了提高数据质量的方法.  相似文献   

7.
邵天会  胡建华 《河南科学》2012,30(11):1601-1604
由于数据库中处理数据标准不同,当用户构建数据仓库时,会产生不同效果的问题.而ETL作为数据处理的基本工具,能够在数据仓库构建的过程中提供稳定、高效、可靠的数据.ETL在数据仓库创建过程中起着举足轻重的地位,构建一种基于ETL多点缓存技术的数据仓库,可为用户提供一种稳定的、高质量的数据仓库.  相似文献   

8.
ETL是构建数据仓库的核心,点击流数据仓库无论在体系结构上,维表与事实表设计上,还是点击流的抽取、转换和装载机制上,都比传统的数据仓库要复杂的多。本文在总结了传统的数据仓库构建基础上,着重分析了点击流数据仓库的ETL技术,为以后在点击流数据仓库中进行数据挖掘做了准备。  相似文献   

9.
数据仓库清洗技术讨论   总被引:4,自引:0,他引:4  
数据仓库建设过程中最关键的环节是数据集成,本文重点分析了数据清洗需要解决的问题及涉及的主要技术,针对数据库的数据模型与数据仓库模型的区别讨论了利用元数据的映射规则的数据清洗方法.  相似文献   

10.
针对福建省房地产市场数据仓库建设中,各设区市房地产市场数据源存在异构性、低质量和数据标准不统一的特点,定义了ETL过程中数据交换标准和数据交换前置包,并详细阐述了ETL在福建省房地产市场数据仓库建设中的实现过程.  相似文献   

11.
本文通过对当前国内电信市场中数据仓库规划和应用的分析和探讨,得出数据仓库中数据质量问题的来源,并且对此提出了一系列的解决方法,以提升数据仓库中的数据质量。  相似文献   

12.
电信业务数据仓库平台中接口的设计与ETL开发   总被引:1,自引:0,他引:1  
针对当前电信业务中各业务系统的数据库之间没有很好地连接而形成信息孤岛的问题,利用数据仓库这一新型的数据组织及存储方法,对电信业务进行有效的数据分析和企业决策.针对业务数据,构建数据仓库平台,对功能框架和软件进行部署.通过接口设计对数据进行必要的规范和组织,依据该规范和约定进行环境配置,将预处理后的数据经DI Designer加载到数据库中,通过ETL(Extraction Transformation Loading)完成数据获取、存储及访问.该平台的建立能对各生产系统的数据加以统一,为前台的展示开发提供强有力的后台支持,便于决策层对企业发展状况更为准确的把握.  相似文献   

13.
浅谈数据集成相关技术   总被引:1,自引:0,他引:1  
随着信息化的普及、推广及建设,更多的信息系统投入使用,一方面提高了工作效率、带来了经济社会效益,但另一方面因为信息系统独立、数据源分布异构等原因形成了越来越多的"信息孤岛"现象,为了解决"信息孤岛"问题,数据集成成为一种重要的解决方法。数据集成技术目前已成为社会研究和讨论的热点领域,数据集成的好与坏直接影响信息化建设速度。该文首先阐述了数据集成的产生及作用,其次介绍了一种通用的数据集成模型框架,基于此模型框架从数据质量的角度对ETL(Extraction数据抽取、Transformation数据转换、Loading数据加载)及数据清洗等关键技术进行了研究和介绍,对数据集成的普及和推广有指导意义。  相似文献   

14.
本文分析了信息产业资源共享与分析平台建设中面临的问题,提出了基于ETL(ExtractTransformLoad,抽取、转换、加载)的解决方案及建设方法,实现了对信息产业数据准确的变化感知,灵活的数据映射和完善的数据管理功能,为信息产业的决策分析提供了基础平台,为其他行业的资源共享与分析平台建设提供了借鉴方案.  相似文献   

15.
首先提出了数据仓库中数据集成的一个总体框架;然后探讨了数据集成在数据仓库设计方案中的作用、所要解决的问题、工作流程等;最后,介绍作者依据这一框架所开发的"铁路货票信息综合利用系统数据仓库解决方案"的数据集成工具DWE-DI.  相似文献   

16.
数据ETL问题研究   总被引:3,自引:0,他引:3  
数据ETL(Data Extraction,Transformation and Loading)是数据仓库、数据挖掘以及商业智能等技术的基石,其主要用来实现异构多数据源的数据集成.首先简单介绍了ETL概念、背景、应用领域,然后着重讨论了ETL在异构数据源集成和脏数据检测中的应用、所面临的挑战等问题.最后总结介绍了ETL的三大发展趋势。  相似文献   

17.
基于Web的数据仓库   总被引:5,自引:1,他引:5  
基于Web的数据仓库是Web技术和数据仓库技术结合的产物.本文给出了其系统结构及其优点,概述了在其实现中所使用的与Web相关的特有技术,并指出系统实现中需要解决的其它问题以及可能的解决方案.  相似文献   

18.
牛田  谢文阁 《科技信息》2010,(25):I0024-I0025
针对目前高校就业领域所存在的问题,在阐述数据仓库概念和功能的基础上,介绍了建立高校就业数据仓库的总体过程,并且建立了高校就业信息的数据仓库维度模型。阐述了高校就业数据仓库的物理设计和数据清洗(ETL)系统开发的步骤,完成了高校就业信息的关系数据仓库数据库的设计。  相似文献   

19.
基于无监督学习的数据清洗算法   总被引:2,自引:0,他引:2  
为了解决数据仓库中相似重复记录的数据问题,提出了基于无监督学习的数据清洗算法.该算法采用基于Hebbian假设的自适应学习方法,并通过相似度确定奖励和惩罚等级.在学习过程中根据需要增加新的聚类,在学习结束后,通过分析聚类情况删除错误的聚类,从而避免了死神经元问题并使聚类更加准确.实验表明,该算法能准确地完成实体识别.  相似文献   

20.
通过对银行决策支持系统的功能需求进行分析。给出了基于数据仓库技术的银行决策支持系统结构设计与实现过程,并对设计过程中涉及的决策支持系统的体系结构、技术特点进行深人的研究,提出一些新的实现方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号