首页 | 本学科首页   官方微博 | 高级检索  
     检索      

Web日志挖掘及AprioriAll算法的改进
引用本文:王彤,何丕廉.Web日志挖掘及AprioriAll算法的改进[J].天津理工大学学报,2007,23(1):13-17.
作者姓名:王彤  何丕廉
作者单位:1. 天津大学,职业技术教育学院,天津,300072
2. 天津大学,计算机科学与技术学院,天津,300072
基金项目:国家自然科学基金;天津市科技发展基金;天津市应用基础研究项目
摘    要:阐述了利用数据挖掘技术对Web日志进行挖掘的可能性及其重要作用.通过用户维的引入,对已有的Apri-oriAll算法进行了改进,改进后的算法降低了原算法的时空复杂度,特别是在新算法中可以对Web日志数据按用户维进行切片,消除了原算法中的I/O相关性.这不仅使对Web日志数据进行的挖掘活动可以分散地进行,而且使多机连网分布式挖掘成为可能,同时还可以实现对Web日志的增量挖掘和动态挖掘.此外,该改进算法的特殊意义还在于它不仅可以将所有用户看作一个整体进行挖掘,而且还可以对不同的用户个体的行为进行独立地挖掘,使挖掘出的结果能够满足对用户个性化使用的需求.

关 键 词:数据挖掘  Web日志  算法改进  用户维
文章编号:1673-095X(2007)01-0013-05
收稿时间:2006-11-06
修稿时间:2006年11月6日

Web log mining and the improvement of the AprioriAll algorithm
WANG Tong,HE Pi-lian.Web log mining and the improvement of the AprioriAll algorithm[J].Journal of Tianjin University of Technology,2007,23(1):13-17.
Authors:WANG Tong  HE Pi-lian
Institution:1. School of Vocational Technique Instruction; 2. School of Computer Science and Technology, Tianjin University, Tianjin 300072, China
Abstract:This paper sets forth the possibility and importance about applying data mining in Web logs mining.By making use of the user dimension,it offers an improved algorithm based on the original AprioriAll algorithm,which has been used in Web logs mining widely.The improved algorithm not only has lower cost of time and space consuming than the original one,but also eliminates the correlation between the input and output data in the original algorithm by slicing up the Web log as the user dimension.So the mining process can be distributed,and the utilization of the multi-processors is possible.At the same time,slicing by the user dimension,it can make the mining process increasingly and dynamically.Further more,in the improved algorithm,the users can be used as a whole to be mined or be mined individually to fit the personal need.
Keywords:data mining  Web log  improved algorithm  the user dimension
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号