数据清洗前的预处理方法 |
| |
作者姓名: | 唐懿芳 钟达夫 张师超 |
| |
作者单位: | 广西师范大学数学与计算机科学学院,广西桂林,541004;广西师范大学数学与计算机科学学院,广西桂林,541004;悉尼科技大学信息技术学院,澳大利亚悉尼 |
| |
基金项目: | 澳大利亚国家大型项目(ARC:DP0343109)资助。 |
| |
摘 要: | 为提高数据清洗的质量,提出消除脏数据域、使用统一的缩写、数据的转换等预处理方法,基于这3种方法和链表存储复制记录算法,设计一个数据清洗的系统,与其他方法的效率与准确程度比较可知,该系统的数据准确程度要高于现有的数据清洗系统.
|
关 键 词: | 数据清洗 脏数据 预处理 外部源文件 |
文章编号: | 1005-9164(2005)02-0118-05 |
收稿时间: | 2005-01-06 |
修稿时间: | 2005-01-06 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
| 点击此处可从《广西科学》浏览原始摘要信息 |
|
点击此处可从《广西科学》下载全文 |
|