首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种分布式Web使用模式挖掘模型及算法
引用本文:张克君,杨炳儒,赵耿,曲文龙,李欣.一种分布式Web使用模式挖掘模型及算法[J].北京科技大学学报,2006,28(9):896-901.
作者姓名:张克君  杨炳儒  赵耿  曲文龙  李欣
作者单位:1. 北京电子科技学院计算机科学与技术系,北京,100070;北京科技大学信息工程学院,北京,100083
2. 北京科技大学信息工程学院,北京,100083
3. 北京电子科技学院计算机科学与技术系,北京,100070
基金项目:国家自然科学基金 , 北京电子科技学院校科研和教改项目
摘    要:给出了一种分布式Web日志挖掘模型DWLMS. 根据对挖掘过程及算法进行分析,提出了一种基于DWLMS的局部频繁路径的更新算法LFP和全局频繁路径的更新算法GFP,较好地解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难. 在实验室对该方法进行了简单实现和实际日志数据的测试,结果表明了算法的有效性.

关 键 词:分布式数据挖掘  Web使用模式挖掘  Web日志挖掘  频繁路径  分布式  使用模式  挖掘模型  更新算法  mining  pattern  distributed  algorithms  有效性  结果  测试  日志数据  方法  实验室  挖掘过程  模式分析  因素  通讯  增长  异地存储
收稿时间:2005-07-20
修稿时间:2005-09-09

Construction and algorithms of distributed web usage pattern mining
ZHANG Kejun,YANG Bingru,ZHAO Geng,QU Wenlong,LI Xin.Construction and algorithms of distributed web usage pattern mining[J].Journal of University of Science and Technology Beijing,2006,28(9):896-901.
Authors:ZHANG Kejun  YANG Bingru  ZHAO Geng  QU Wenlong  LI Xin
Institution:1. Department of Computer Science and Technology, Beijing Electronic Science and Technology Institute, Beijing 100070, China 2. Information Engineering School, University of Science and Technology Beijing, Beijing 100083, China
Abstract:A distributed Web log mining system model (DWLMS) is presented. Based on the analysis on the procedure and algorithm of Web frequent access pattern mining, the more general incremental updating algorithms of local frequent paths (LFP) and global frequent paths (GFP) in a distributed database system based on DWLMS are proposed for discovering the frequent access paths. Some troubles produced by real time incremental distributed Web access information and more communication data are solved better by the algorithms. The method was realized simply and tested with real world Web log information in laboratory, and the results show that the algorithms are valid.
Keywords:distributed data mining  Web access pattern mining  Web log mining  frequent path
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号