首页 | 本学科首页   官方微博 | 高级检索  
     检索      

面向数据质量的ETL过程建模与实现
引用本文:贾自艳,黄友平,罗平,李嘉佑,秦亮曦,史忠植.面向数据质量的ETL过程建模与实现[J].系统仿真学报,2004,16(5):907-911,914.
作者姓名:贾自艳  黄友平  罗平  李嘉佑  秦亮曦  史忠植
作者单位:1. 中国科学院计算技术研究所智能信息处理重点实验室,北京,100080;中国科学院研究生院,北京,100039
2. 中国科学院计算技术研究所智能信息处理重点实验室,北京,100080
基金项目:国家自然科学基金(60173017,90104021),北京自然科学基金(4011003)
摘    要:为了给数据仓库提供高质量的数据,在数据装载到数据仓库之前必须经过数据的抽取-转换-装载(Extraction-Transformation-loading,ETL)这一系列的预处理工作。复杂性和可用性是制约ETL系统的两大基本问题。为解决这些问题,给出了ETL过程统一的体系结构设计,包括ETL元数据对象建模、ETL转换函数设计、ETL任务建模以及ETL任务模型的描述语言(XTDL)。基于该体系结构和设计思想开发出一个ETL系统-MSETL,目的是为多策略数据挖掘平台(MSMiner)提供高质量的数据。它提供友好界面并对ETL过程进行统一的元数据管理,包括:ETL转换函数的注册和删除;任务模型的生成、执行和删除等功能。

关 键 词:数据仓库  数据质量  抽取-转换-装载(ETL)  数据挖掘  数据清洗
文章编号:1004-731X(2004)05-0907-05

ETL Processes Modeling and Realization towards Data Quality
JIA Zi-yan,HUANG You-ping,LUO ping,LI Jia-you,QIN Liang-xi,SHI Zhong-zhi.ETL Processes Modeling and Realization towards Data Quality[J].Journal of System Simulation,2004,16(5):907-911,914.
Authors:JIA Zi-yan    HUANG You-ping    LUO ping    LI Jia-you    QIN Liang-xi    SHI Zhong-zhi
Institution:JIA Zi-yan1,2,HUANG You-ping1,2,LUO ping1,2,LI Jia-you1,2,QIN Liang-xi1,2,SHI Zhong-zhi1
Abstract:
Keywords:data warehouse  data quality  extraction-transformation-loading (ETL)  data mining  data cleaning
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号