首页 | 本学科首页   官方微博 | 高级检索  
     检索      

Web日志挖掘中数据预处理技术研究
引用本文:方元康,胡学钢,夏启寿.Web日志挖掘中数据预处理技术研究[J].安庆师范学院学报(自然科学版),2008,14(3).
作者姓名:方元康  胡学钢  夏启寿
作者单位:合肥工业大学,计算机信息学院,安徽,合肥,230009;池州学院,计算机中心,安徽,池州,247000;合肥工业大学,计算机信息学院,安徽,合肥,230009;池州学院,计算机中心,安徽,池州,247000
基金项目:安徽省教育厅自然科学基金,池州学院自然科学基金
摘    要:Web日志挖掘的基本思想是将数据挖掘技术应用于Web日志数据源。在数据挖掘研究领域中,数据预处理起着至关重要的作用。Web日志挖掘的数据源最主要的是Web日志,根据Web日志的特点,在预处理过程中的会话识别阶段给出一种基于过滤框架网页与页面访问时间阈值相结合的会话识别方法,实验数据验证说明该方法可以显著地提高Web日志挖掘结果的兴趣性。

关 键 词:Web挖掘  数据预处理  阈值  Frame页面  会话识别

Research of Data Preparation Based on Web Log Mining
FANG Yuan-kang,HU Xue-gang,XIA Qi-shou.Research of Data Preparation Based on Web Log Mining[J].Journal of Anqing Teachers College(Natural Science Edition),2008,14(3).
Authors:FANG Yuan-kang  HU Xue-gang  XIA Qi-shou
Institution:FANG Yuan-kang1,2,HU Xue-gang1,XIA Qi-shou2(1.Computer & Information College,Hefei University of Technology,Hefei 2300092.Center of Computer Technology,Chizhou College,Chizhou 247000,China)
Abstract:The basic idea of Web log mining is to apply the technology of data mining to the data source of Web usage.Data preprocessing plays an important role in the field of Web usage mining.The data source of Web log mining is mainly composed of Web logs.This paper introduces detailed content of Web logs.In the light of features of Web logs,some special processing methods of preprocessing are introduced.At the same time,a newly algorithm based on frame-filtering and the access time threshold is proposed at the sta...
Keywords:web mining  data preprocessing  threshold  Frame page  session reconstruction  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号