首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于网络日志的数据挖掘预处理改进方法
引用本文:孙宇航,孙应飞.基于网络日志的数据挖掘预处理改进方法[J].系统工程与电子技术,2009,31(12):2994-2997.
作者姓名:孙宇航  孙应飞
作者单位:中国科学院研究生院, 北京 100049
摘    要:对网络日志数据挖掘预处理技术进行研究,针对Frame页面过滤方法与超时阈值设定进行分析,提出了应用ID3算法改进Frame页面过滤过程中丢失SubFrame页面信息且需要进行站点提升步骤。在超时阈值的设定方面采用动态修正方法,提高预处理技术对长时间会话的识别能力的改进方法。通过实验验证,该方法有效地减少了预处理过程中的信息丢失,同时提高了挖掘结果的精度。

关 键 词:网络日志  数据挖掘  预处理  会话识别

Improved method of data mining preprocessing based on Web log
SUN Yu-hang,SUN Ying-fei.Improved method of data mining preprocessing based on Web log[J].System Engineering and Electronics,2009,31(12):2994-2997.
Authors:SUN Yu-hang  SUN Ying-fei
Institution:Graduate Univ. of Chinese Academy of Science, Beijing 100049, China
Abstract:Data preprocessing method of Web log mining is studied. Frame pages filtering and overtime threshold value seting are analyzed. The improved method based on induction of decision tree(ID3) algorithm and threshold value dynamic amendment algorithm is proposed. This method deals with information loss by Frame pages filtering and threshold value fixing. Transaction session identification ability is also enchanced. The experiment about this method shows that this method is efficient in improving accuracy of mining result.
Keywords:Web log  data mining  preprocessings transaction session identification
本文献已被 万方数据 等数据库收录!
点击此处可从《系统工程与电子技术》浏览原始摘要信息
点击此处可从《系统工程与电子技术》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号