首页 | 本学科首页   官方微博 | 高级检索  
     

数据挖掘技术在统计预处理中的应用
作者姓名:谭耀文  谭义红  李学勇
作者单位:1. 株洲市统计局,湖南,株洲,430012
2. 湖南大学,计算机与通信学院,湖南,长沙,410082
3. 长沙大学,数学与信息科学系,湖南,长沙,410003
基金项目:湖南省自然科学基金资助项目(编号:01JJY1007)
摘    要:
目前统计分析面临的数据大多不再是预先设定的样本数据,而是杂乱、不规范的大规模的海量数据,所以统计分析之前进行数据预处理是非常必要的。采用数据挖掘技术,对存在空缺值、噪声数据等不规范的数据集进行清理,对海量数据进行维规约和自动产生概念分层处理,以缩小数据集的规模。经过预处理的数据集能更好地适应原有统计方法,并提高了统计质量。

关 键 词:数据挖掘技术 应用 统计分析 海量数据 数据预处理 数据集 样本数据 噪声数据 分层处理 自动产生 统计方法 统计质量 规模 规约
文章编号:1671-0231(2005)02-0076-03
修稿时间:2004-07-06
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号