首页 | 本学科首页   官方微博 | 高级检索  
     检索      

面向多数据源的数据清洗关键技术的研究
引用本文:王咏梅,嵇晓,汪恒杰,冯安平.面向多数据源的数据清洗关键技术的研究[J].科技资讯,2009(1):13-15.
作者姓名:王咏梅  嵇晓  汪恒杰  冯安平
作者单位:1. 上海工程技术大学高职学院,上海,200437
2. 上海宝信软件,上海,201203
摘    要:对于各个领域的信息资源管理而言,数据质量一直是一个非常关键的问题。现实世界中的数据往往存在着各种各样的问题,从简单的拼写错误到复杂的语义不一致错误。数据清洗的目标就是检测并去除数据中存在的各种错误和不一致,提高数据的质量。该文归纳、总结了数据清洗相关研究的现状,提出一个面向多数据源的数据清洗框架的定义。框架实现了术语模型、处理描述文件和共享库等概念和技术。

关 键 词:数据质量  数据清洗  面向多数据源的数据清洗框架

Research on Key Technologies of Data-cleaning With Multi-source
Wang Yongmei,Ji Xiao,Wang Hengjie,Feng Anping.Research on Key Technologies of Data-cleaning With Multi-source[J].Science & Technology Information,2009(1):13-15.
Authors:Wang Yongmei  Ji Xiao  Wang Hengjie  Feng Anping
Institution:Wang Yongmei Ji Xiao Wang Hengjie Feng Anping (1 .Shanghai University of Engineering Science, Advanced Vocational Technical College, Shanghai 200437; 2.Shanghai Baosight Software Company, Shanghai 201203)
Abstract:
Keywords:Data quality  Data cleaning  multi-source Data-cleaning framework
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号