首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于投影位置的序列模式挖掘算法
引用本文:王伟娜,李陶深,陈庆锋.基于投影位置的序列模式挖掘算法[J].华中科技大学学报(自然科学版),2012(Z1):104-107.
作者姓名:王伟娜  李陶深  陈庆锋
作者单位:广西大学计算机与电子信息学院;东华软件股份有限公司
基金项目:国家自然科学基金资助项目(60973074)
摘    要:针对PrefixSpan算法在产生频繁序列模式(特别是挖掘密数据集和长序列模式)时会产生大量的投影数据库,使得算法性能下降的问题,提出一种基于投影位置的序列模式挖掘(PSPM)算法.该算法利用Apriori性质舍弃对非频繁项存储,节省了存储空间和扫描不可能出现序列的挖掘时间;在递归挖掘过程中,利用投影位置表直接定位投影序列位置进行挖掘局部频繁项,避免了构造投影数据库,从而提高执行效率.实验结果表明:与PrefixSpan(with pseudo-pro)算法相比,PSPM具有更好的执行效率和可伸缩性.

关 键 词:数据挖掘  序列模式  PrefixSpan  投影位置  投影数据库

Projection position-based sequential pattern mining algorithm
Wang Weina,Li Taoshen,Chen Qingfeng.Projection position-based sequential pattern mining algorithm[J].JOURNAL OF HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY.NATURE SCIENCE,2012(Z1):104-107.
Authors:Wang Weina  Li Taoshen  Chen Qingfeng
Institution:1(1 School of Computer,Electronics and Information,Guangxi University,Nanning 530004,China; 2 DHC Software Co.Ltd.,Beijing 100190,China)
Abstract:
Keywords:
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号