首页 | 本学科首页   官方微博 | 高级检索  
     检索      

数据清洗前的预处理方法
引用本文:唐懿芳,钟达夫,张师超.数据清洗前的预处理方法[J].广西科学,2005,12(2):118-122.
作者姓名:唐懿芳  钟达夫  张师超
作者单位:广西师范大学数学与计算机科学学院,广西桂林,541004;广西师范大学数学与计算机科学学院,广西桂林,541004;悉尼科技大学信息技术学院,澳大利亚悉尼
基金项目:澳大利亚国家大型项目(ARC:DP0343109)资助。
摘    要:为提高数据清洗的质量,提出消除脏数据域、使用统一的缩写、数据的转换等预处理方法,基于这3种方法和链表存储复制记录算法,设计一个数据清洗的系统,与其他方法的效率与准确程度比较可知,该系统的数据准确程度要高于现有的数据清洗系统.

关 键 词:数据清洗  脏数据  预处理  外部源文件
文章编号:1005-9164(2005)02-0118-05
收稿时间:2005/1/6 0:00:00
修稿时间:2005年1月6日

Pre-Processing for Data Cleansing
Tang Yifang,Zhong Dafu and Zhang Shichao.Pre-Processing for Data Cleansing[J].Guangxi Sciences,2005,12(2):118-122.
Authors:Tang Yifang  Zhong Dafu and Zhang Shichao
Institution:Tang Yifang~1,Zhong Dafu~1,Zhang Shichao~
Abstract:For improving the quality of data cleaning,it provides three pre-process methods,such as eliminating dirty data,using unified abbreviation,data converstion.Based on these methods,using link table to store replicate recorders algorithm,implementing a data cleansing system.This cleaning system has a higher veracity than the existing one.
Keywords:data cleansing  dirty data  pre-processing  external source file
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《广西科学》浏览原始摘要信息
点击此处可从《广西科学》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号