首页 | 本学科首页   官方微博 | 高级检索  
     

基于web日志挖掘的数据预处理研究
作者姓名:曹明  闪四清
作者单位:北京航空航天大学经济管理学院管理信息系统系,北京,100083
摘    要:Web日志信息的预处理是Web日志挖掘任务中的重要阶段,也是工作量较大的一部分.Web服务器上的数据是半结构化的,而且含有大量和挖掘无关的记录和冗余项.这就需要对其进行处理以得到适合挖掘的数据事务(Transaction)形式.Web日志预处理就是通过一系列的清洗、集成、转换等来得到合适的待挖掘数据.本文重点介绍了数据清理、用户识别、会话识别、路径补充、事务识别等过程.

关 键 词:Web日志挖掘  数据挖掘  会话识别  事务识别
文章编号:1672-3791(2007)02(a)-0103-03
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号