期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

赖娟金澎洪艳伟《西南师范大学学报(自然科学版)》2013,38(7)

传统的频繁模式挖掘算法产出大量的频繁模式,这些大量的频繁模式对于后期的分析、处理以及理解都带来了相当大的挑战.针对上述问题,该文提出了一种改进的压缩频繁模式挖掘算法,该算法基于CFP-树通过对传统频繁模式挖掘算法的改进能够从大量的频繁模式中选择出规模更小的频繁模式代表集合,从而起到减小庞大的频繁模式挖掘结果规模的目的.实验中还将该算法和现有的RPlocal算法进行了对比,结果表明改进的压缩频繁模式挖掘算法能够在合理的时间及容错范围内获得更小的频繁模式代表集,同时大大降低了时间复杂度,提高了挖掘效率. 相似文献

2.

一种快速频繁模式挖掘算法

石杰《烟台大学学报(自然科学与工程版)》2015,(2):113-118

频繁模式挖掘是数据挖掘领域中一个重要的研究方向,目前已有很多算法被用于挖掘频繁模式.本文在研究FP-growth算法的基础上,提出一种新的频繁模式挖掘算法——QFP算法.首先对每一个频繁项建立一棵QFP树,进而根据设定的条件对每棵树进行挖掘,直到找出符合条件的频繁模式.实验证明该算法能够减少条件子树的生成数量,降低对内存空间的依赖和CPU的计算时间,从而提高关联规则挖掘的效率. 相似文献

3.

一种基于分治策略与位运算的频繁项集挖掘算法

易宗剑彭月英覃晓唐涛《广西师范学院学报(自然科学版)》2015,(1)

为提高挖掘频繁项集的效率,在垂直数据格式下,结合分治思想提出一种基于分治策略与位运算频繁项集挖掘算法DC-FIMBII。利用分治将数据库中的事务划分为多个非重叠部分,对每一部分采用位运算求交计算支持度,从而减少操作时项集的规模和项集的比较次数。在mushroom、pumsb_star和T40I10D100K等数据集上,对DC-FIMBII、Apriori、Eclat、DF-FIMBII等算法进行比较。实验表明,DC-FIMBII具有更高的效率。相似文献

4.

一种基于频繁模式有向无环图的数据流频繁模式挖掘算法

任家东王倩王蒙《燕山大学学报》2011,35(2):115-120

频繁模式挖掘中基于FP-growth的算法需要扫描两次事务数据库,预先给定支持度,且不支持时间敏感型数据。本文提出了一种基于频繁模式有向无环图的数据流频繁模式挖掘算法,它根据事务到来的时间给每个事务一个序号,每个事务中的数据项在存储前按数据项的顺序进行调整,频繁模式有向无环图的构建遵循这个顺序并用序号来记录事务与数据项的包含关系,模式增长过程只需要增加有向边上的序号。通过逆向遍历带有相同序号的有向边,产生条件模式基,根据动态定义的阈值抽取条件模式基信息,一次扫描数据库得到频繁模式。实验结果表明,本文算法的执行效率优于FP-growth算法,且存储节点的数目明显减少。相似文献

5.

一种基于FP-tree挖掘最大频繁模式的改进算法

王华金兰红《长春工程学院学报(自然科学版)》2007,8(1):59-62

提出一种最大频繁模式挖掘的改进算法(FP-Imax),该算法引入一种与FP-tree类似的结构MFI-tree来存储所有的最大频繁项目集,并采用有效的子集检查方法进行优化,降低了算法的时空开销,提高了挖掘效率。实验表明,与FP-Max相比该算法的挖掘速度快两2—3倍。相似文献

6.

一种基于MP-tree的频繁路径挖掘算法

赵利徐永成胡孔法陈崚《扬州大学学报(自然科学版)》2012,(1):56-59

针对应用射频识别(radio frequency identification,RFID)技术产生的海量数据,引入挖掘频繁路径的思想,提出挖掘频繁路径的算法MP(movement path)-mine.该算法通过构建MP-tree的形式,只须扫描数据库一次就可以挖掘出所有的频繁移动路径,便于快速向用户提供物品移动趋势方面的信息.理论分析和实验结果表明该算法性能非常有效. 相似文献

7.

频繁独立模式挖掘

何秋红周忠眉《漳州师范学院学报》2008,21(4)

高频独立模式对无相关属性选择有一定意义.给出挖掘频繁独立模式算法,并在标准数据挖掘数据集蘑菇数据上测试,得到蘑菇数据在一定度量下的所有频繁独立模式,实验结果表明了挖掘算法的有效性. 相似文献

8.

一种基于映射方法的改进频繁模式增长算法

李畅畅曾黄麟孙勇王振明《四川理工学院学报(自然科学版)》2009,22(3):80-82

文章介绍了知识发现中关联规则挖掘算法的基本思想及其性能,分析了FP-tree算法在关联规则挖掘中存在耗费巨大空间存贮的问题,提出了一种运用投影技术改进的频繁模式增长算法,该算法改善FP-tree构造,实验结果表明,运用投影技术改进的频繁模式增长算法可以提高关联规则挖掘效果。相似文献

9.

一种新的最大频繁项集挖掘算法

杜垒王俊京《科技信息》2011,(14):I0238-I0238

基于深度优先及宽度优先的频繁项集挖掘算法存在着一定的不足,在这里引进了一种新的挖掘方法,提高了挖掘的效率。相似文献

10.

频繁序列模式挖掘算法 总被引：5，自引：0，他引：5

管恩政周春光王喆徐秀娟《吉林大学学报(信息科学版)》2005,23(3):267-272

为解决从数据库中挖掘长模式和支持度较低时可能遇到计算复杂度较高的问题,提出一种新的算法--EFSPAN(Effective Frequent Sequential PAtterN mining algorithm).算法采用了深度优先挖掘策略,并将基于前缀序列格的深度优先遍历与两种高效的剪枝策略相结合.实验结果表明:新算法在模式较长和支持度较低时,能使搜索空间中60%以上的节点免被搜索;从而大大缩小了搜索空间,降低了序列模式挖掘算法的计算复杂度. 相似文献

11.

Constructing Projection Frequent Pattern Tree for Efficient Mining

Xiang Jian-wen He Yan-xiang Kokichi Futatsugi Kong Wei-qiangSchool of Computer Wuhan University Wuhan Hubei China State Key Lab of Software Engineering Wuhan University Wuhan Hubei China School of Information Science Japan Advanced Institute of Science Technology - Asahidai Tatsunokuchi Ishikawa - Japan 《武汉大学学报:自然科学英文版》2003,8(2):351-357

Frequent Pattern mining plays an essential role in data mining. Most of the previous studies adopt an Apriori-like candidate set generation-and-test approach. However, candidate set generation is still costly, especially when there exist prolific patterns and/or long patterns.In this study, we introduce a novel frequent pattern growth (FP-growth) method, which is efficient and scalable for mining both long and short frequent patterns without candidate generation. And build a new projection frequent pattern tree (PFP-tree) algorithm on this study, which not only heirs all the advantages in the FP-growth method, but also avoids it's bottleneck in database size dependence when constructing the frequent pattern tree (FP-tree). Efficiency of mining is achieved by introducing the projection technique, which avoid serial scan each frequent item in the database, the cost is mainly related to the depth of the tree, namely the number of frequent items of the longest transaction in the database, not the sum of all 相似文献

12.

An efficient hybrid algorithm for mining Web frequent access patterns 总被引：1，自引：0，他引：1

ZHANLi-qiang LIUDa-xin 《武汉大学学报:自然科学英文版》2004,9(5):557-560

We propose an cfficienl hybrid algorithm WDHP in this paper for mining frequent access patterns. WDHP adopts the techniques of DHP optimize its performance, which is using hash the to filter candidate set and trimming database. Whenever the database is trimmed to a size tess than a specified threshold, the algorithm puts the database into main memory By constructing a tree. and finds frequent patterns on the tree. The experiment shows that WDHP outperform algorithm DHP and main memory basedalgorithm WAP in execution efficieucy. 相似文献

13.

A Novel Incremental Mining Algorithm of Frequent Patterns for Web Usage Mining

DONG Yihong ZHUANG Yueting TAI Xiaoying 《武汉大学学报:自然科学英文版》2007,12(5):777-782

Because data warehouse is frequently changing, incremental data leads to old knowledge which is mined formerly unavailable. In order to maintain the discovered knowledge and patterns dynamically, this study presents a novel algorithm updating for global frequent patterns-IPARUC. A rapid clustering method is introduced to divide database into n parts in IPARUC firstly, where the data are similar in the same part. Then, the nodes in the tree are adjusted dynamically in inserting process by ＂pruning and laying back＂ to keep the frequency descending order so that they can be shared to approaching optimization. Finally local frequent itemsets mined from each local dataset are merged into global frequent itemsets. The results of experimental study are very encouraging. It is obvious from experiment that IPARUC is more effective and efficient than other two contrastive methods. Furthermore, there is significant application potential to a prototype of Web log Analyzer in web usage mining that can help us to discover useful knowledge effectively, even help managers making decision. 相似文献

14.

基于频繁模式矩阵的改进挖掘算法研究

李伟《科学技术与工程》2010,10(4)

提出了对基于频繁模式矩阵Fp-array的挖掘的改进算法。首先对各项的投影矩阵预处理划分成若干同维矩阵,并根据同维矩阵的权值对剩余未搜索项进行预先判断,进而对搜索最大频繁项目集进行有效剪枝,减少了搜索范围。经过实验和算法分析,证明了改进算法具有明显的优越性。相似文献

15.

基因表达数据的频繁闭合模式挖掘新算法

缪裕青陈国良徐云《中国科学技术大学学报》2007,37(9):1080-1087

基因表达数据集与传统事务数据集相比呈现出新的特征,由于其项目数远远大于事务数,使得大量现有的基于项目枚举的频繁闭合模式挖掘算法不再适用.为此提出一种频繁闭合模式挖掘新算法TPclose,使用TP-树(tidset-prefix tree)保存项目的事务集信息.该算法将频繁闭合模式挖掘问题转换成频繁闭合事务集挖掘问题,采取自顶向下分而治之的事务搜索策略,并组合了高效的修剪技术和有效的优化技术.实验表明,TPclose算法普遍快于自底向上事务搜索算法RERⅡ,最高达2个数量级以上. 相似文献

16.

基因表达数据的频繁模式挖掘算法

下载免费PDF全文

寇晨艳郭红《福州大学学报(自然科学版)》2009,37(2)

使用关联规则的方法来挖掘基因表达数据,在研究分析经典关联规则挖掘算法优缺点的基础上,立足于基因表达数据所呈现的新特征,提出一种基于BSC_tree的分段与运算基因表达数据频繁模式挖掘新算法BSC-AND.实验结果表明,与FP-growth和FIS算法相比,所提出的算法具有更低的时间复杂性. 相似文献

17.

最大频繁模式挖掘算法在图书馆个性化信息服务中的应用

叶福兰施忠兴《长春工程学院学报(自然科学版)》2012,13(3):98-101

图书馆的不断数字化、个性化信息服务已经成为图书馆服务的一个热点问题,它改变了图书馆传统的被动服务方式,变被动服务为主动服务。首先介绍了数据挖掘与图书馆个性化信息服务的相关理论,进而介绍了数据挖掘技术在图书馆个性化信息服务中的应用,其次利用借阅记录分析了基于FP_tree的最大频繁模式挖掘算法,最后简要介绍了个性化信息服务系统设计过程。相似文献

18.

基于频繁模式树的关联分类规则挖掘算法 总被引：1，自引：1，他引：1

朱玉全宋余庆杨鹤标陈健美《江苏大学学报(自然科学版)》2006,27(3):262-265

构建精确而有效的分类器是数据挖掘和机器学习中的一个重要任务．提出了一种基于频繁模式树的关联分类规则挖掘算法,该算法同时考虑所有属性,并对现有关联分类规则挖掘算法中内存要求高、类别属性处理难、I／O访问次数多等问题提出了相应的解决方案．试验结果表明,该方法可以取得比同样基于关联规则的分类算法CMAR更高的执行效率以及基于规则的决策树分类算法C4．5更好的分类效果．相似文献