首页 | 本学科首页   官方微博 | 高级检索  
     检索      

改进的PrefixSpan算法在Web挖掘中的应用
引用本文:谢清森,杨天奇.改进的PrefixSpan算法在Web挖掘中的应用[J].南京邮电大学学报(自然科学版),2009,9(23).
作者姓名:谢清森  杨天奇
作者单位:暨南大学,暨南大学
基金项目:广东省自然科学基金项目(5006102)
摘    要:针对PrefixSpan算法不足,本文采用修改Prefix策略与舍弃非频繁项的方法,减少内存与外存之间频繁地交换,减小在挖掘过程中产生的投影数据库规模,降低构建、扫描投影数据库的时空耗费,从而改进算法。实验结果表明,在长序列模式挖掘中,算法在改进后运行效率比原来提高35%以上,更适用于Web挖掘。

关 键 词:Web挖掘  PrefixSpan算法  序列模式
收稿时间:6/30/2009 7:06:18 AM
修稿时间:7/1/2009 4:51:48 PM

Application of Improved PrefixSpan Algorithm in Web Mining
XIEQINGSEN and YANG Tianqi.Application of Improved PrefixSpan Algorithm in Web Mining[J].Journal of Nanjing University of Posts and Telecommunications,2009,9(23).
Authors:XIEQINGSEN and YANG Tianqi
Institution:Jnu University
Abstract:Taking account of insufficiency of PrefixSpan algorithm, which is widely applied to data mining, this paper trys to optimize the algorithm by reducing frequency of exchanging between the memory and the external memory in the Prefix part, and reducing the size of the projection database by discarding the non-frequent items which created in the process of sequence patterns mining. The result of test demonstrates that the operating efficiency is enhanced more than 35%. The conclusion comes to shows that the improved algorithm is applicable to the Web Mining.
Keywords:Web mining  PrefixSpan algorithm  Sequence pattern
点击此处可从《南京邮电大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《南京邮电大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号