数据挖掘技术在统计预处理中的应用 |
| |
作者姓名: | 谭耀文 谭义红 李学勇 |
| |
作者单位: | 1. 株洲市统计局,湖南,株洲,430012 2. 湖南大学,计算机与通信学院,湖南,长沙,410082 3. 长沙大学,数学与信息科学系,湖南,长沙,410003 |
| |
基金项目: | 湖南省自然科学基金资助项目(编号:01JJY1007) |
| |
摘 要: | ![]() 目前统计分析面临的数据大多不再是预先设定的样本数据,而是杂乱、不规范的大规模的海量数据,所以统计分析之前进行数据预处理是非常必要的。采用数据挖掘技术,对存在空缺值、噪声数据等不规范的数据集进行清理,对海量数据进行维规约和自动产生概念分层处理,以缩小数据集的规模。经过预处理的数据集能更好地适应原有统计方法,并提高了统计质量。
|
关 键 词: | 数据挖掘技术 应用 统计分析 海量数据 数据预处理 数据集 样本数据 噪声数据 分层处理 自动产生 统计方法 统计质量 规模 规约 |
文章编号: | 1671-0231(2005)02-0076-03 |
修稿时间: | 2004-07-06 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|