首页 | 本学科首页   官方微博 | 高级检索  
     检索      

Web日志挖掘数据预处理中的会话识别技术
引用本文:许艳丹.Web日志挖掘数据预处理中的会话识别技术[J].中国西部科技,2011,10(4):28-29,15.
作者姓名:许艳丹
作者单位:安徽大学计算机科学与技术学院,安徽,合肥,230039;安徽国防科技职业学院信息工程系,安徽,六安,237011
基金项目:安徽国防科技职业学院基金项目——基于CMS平台的校园网站系统设计与实现(2009gfyz01)
摘    要:会话识别是Web日志挖掘的关键步骤,会话识别的质量直接影响后续挖掘的准确性。本文分析了Web日志挖掘的数据预处理过程中的三种会话识别算法,最终选用时间阈值法对安徽国防科技职业学院服务器日志文件进行会话识别。

关 键 词:Web日志挖掘  数据预处理  会话识别

Sessions' Identification in Data Preprocessing of Web Log Mining
XU Yan-dan.Sessions'' Identification in Data Preprocessing of Web Log Mining[J].Science and Technology of West China,2011,10(4):28-29,15.
Authors:XU Yan-dan
Institution:XU Yan-dan1,2(1.College of Computer Science&Technology,Anhui University,Hefei,Anhui 230039,2.Department of Information and Engineering,Anhui Vocational College of Defense Technology,Liu,an,Anhui 237011)
Abstract:The sessions' identification is a key step in Web log mining.The accuracy of post-mining is influenced by the quality of the sessions' identification directly.In this paper,it analyzed three session identification algorithm in Data Preprocessing of Web Log Mining.Finally,threshold method is chosed on the session identification of Anhui Vocational College of Defense Technology's server log files.
Keywords:Web logmining  Data pre-processing  Sessions' identification  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号