首页 | 本学科首页   官方微博 | 高级检索  
     检索      

Web使用挖掘中数据预处理的研究
引用本文:田倩飞,左源瑞,廖鹏.Web使用挖掘中数据预处理的研究[J].西南师范大学学报(自然科学版),2008,33(6).
作者姓名:田倩飞  左源瑞  廖鹏
作者单位:西南大学,计算机与信息科学学院,重庆,400715
摘    要:对Web使用挖掘中数据预处理阶段所采用的技术做了全面的研究,主要包括数据的来源及清理、用户识别、会话识别、路径补充等步骤及其所采用的技术.在现有Web使用挖掘数据预处理的步骤上提出改进,即在路径补充后,利用最大向前序列法(MFR,Max Forward Reference)进行二次会话识别,克服了原有会话识别中最大向前序列法的缺点.最后给出示例及其结果.

关 键 词:web使用挖掘  Web服务器日志  数据预处理

Research on Data Preprocessing in Web Usage Mining
TIAN Qian-fei,ZUO Yuan-rui,LIAO Peng.Research on Data Preprocessing in Web Usage Mining[J].Journal of Southwest China Normal University(Natural Science),2008,33(6).
Authors:TIAN Qian-fei  ZUO Yuan-rui  LIAO Peng
Institution:TIAN Qian-fei,ZUO Yuan-rui,LIAO PengSchool of Computer , Information Science,Southwest University,Chongqing 400715
Abstract:This paper researches the techniques in data preprocessing of Web usage mining,mainly including the steps and their techniques: sources of data,user identification,session identification and path completion.To give new steps of preprocessing in Web usage mining,that is,using max forward reference method(MFR) to do a session reconstruction.This method can overcome the backwardness of MFR in the first session identification.At last the paper gives an example as well as its results.
Keywords:web usage mining  web server log  data preprocessing  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《西南师范大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《西南师范大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号