首页 | 本学科首页   官方微博 | 高级检索  
     检索      

大数据质量管理:问题与研究进展
引用本文:王宏志.大数据质量管理:问题与研究进展[J].科技导报(北京),2014,32(34):78-84.
作者姓名:王宏志
作者单位:哈尔滨工业大学计算机科学与技术学院, 哈尔滨 150001
基金项目:国家重点基础研究发展计划(973计划)项目(2012CB316200);国家自然科学基金项目(61472099)
摘    要: 当前大数据在多个领域广泛存在,大数据的质量对其有效应用起着至关重要的作用,因而需要对大数据进行质量管理.尽管数据质量管理方面已经有一些研究成果,但由于大数据具有规模大、速度快和多样性高的特点,现有的方法难以适用于大数据质量管理.本文针对错误发现、错误修复和劣质数据查询处理,综述了大数据质量管理的问题与挑战,认为大数据质量管理的挑战主要有计算困难、错误混杂和缺少知识3 个方面.本文依据这3 个方面的解决方法,对大数据质量管理目前的研究进展进行了综述,并展望了大数据质量管理未来的研究方向.

关 键 词:数据质量  大数据  数据清洗  
收稿时间:2014-09-25

Big Data Quality Management: Problems and Progress
WANG Hongzhi.Big Data Quality Management: Problems and Progress[J].Science & Technology Review,2014,32(34):78-84.
Authors:WANG Hongzhi
Institution:Department of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China
Abstract:Big data have wide applications. Since the quality of big data plays a crucial role in these data-centric applications, data quality management techniques for big data are in demand. Although some theories and techniques for data quality management have been proposed, due to the volume, variety and velocity of big data, current methods could hardly be applied to data management for big data. This paper discusses the problems and challenges for error detection, error repair and query processing of dirty data in big data management, and identifies intractability, mixed errors and the lack of knowledge as three new challenges to data quality management. The progress of big data quality management in these three aspects is reviewed and open problems for future research are proposed.
Keywords:data quality  big data  data cleaning  
本文献已被 CNKI 等数据库收录!
点击此处可从《科技导报(北京)》浏览原始摘要信息
点击此处可从《科技导报(北京)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号