首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于server session约束的序列模式增长挖掘研究
引用本文:蔡宏果,元昌安,罗锦光,张增银,石亚冰.基于server session约束的序列模式增长挖掘研究[J].郑州大学学报(理学版),2010,42(1).
作者姓名:蔡宏果  元昌安  罗锦光  张增银  石亚冰
作者单位:广西师范学院,计算机与信息工程学院,广西,南宁,530023
基金项目:国家自然科学基金资助项目,编号60763012; 广西科学研究与技术开发计划重大项目,编号0815007-1-15; 广西研究生创新计划项目,编号2009106030774M03
摘    要:在WUM(Web Usage Mining)中挖掘序列模式的背景下,提出了一种基于server session约束的序列模式增长挖掘算法.首先,为了更好地从网站服务器日志文件中挖掘模式和发现知识,提出了一种基于server session的服务器日志文件格式.同时,引入基于server session的约束概念,利用其能够减少初始序列模式和候选项集大小的特点来减少每次扫描后缀数据库的规模,再从预处理后的日志文件中挖掘WUM的频繁访问路径的序列模式.最后通过实验证明了算法的有效性和优越性.

关 键 词:序列模式  服务器日志文件  服务器会话  Web使用挖掘  数据挖掘

Server Session Constraint-based Serial Pattern Growth Mining Research
CAI Hong-guo , YUAN Chang-an , LUO Jin-guang , ZHANG Zeng-ying , SHI Ya-bing.Server Session Constraint-based Serial Pattern Growth Mining Research[J].Journal of Zhengzhou University:Natural Science Edition,2010,42(1).
Authors:CAI Hong-guo  YUAN Chang-an  LUO Jin-guang  ZHANG Zeng-ying  SHI Ya-bing
Institution:CAI Hong-guo,YUAN Chang-an,LUO Jin-guang,ZHANG Zeng-ying,SHI Ya-bing(School of Computer , Information Engineering,Guangxi Teachers Education University,Nanning 530023,China)
Abstract:In the context of the sequence pattern mining in WUM,a server session constraint-based serial pattern growth mining algorithm is proposed.Firstly,to mine pattern and discover knowledge better from the log file,a server session-based server log file format is proposed.Then,by introducing server session-based constraint concept,which can reduce the initial sequence model and candidate set size,relying on that,the size of the suffix database scanned can be reduced each time.And then the serial pattern of the f...
Keywords:serial pattern  server log file  server session  Web usage mining  data mining  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号