首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
频繁项集挖掘是关联规则挖掘算法的核心,数据流的实时、无限及不可逆性给传统数据挖掘方法带来很大挑战.频繁闭项集挖掘为频繁项集挖掘提供了完整且低冗余的结果,是近年来数据流频繁项集挖掘研究的热点之一.介绍了数据流频繁闭项集挖掘的相关概念,并从搜索空间的遍历策略、误差结果控制方式等方面对数据流频繁闭项集挖掘算法进行了分析比较.  相似文献   

2.
挖掘频繁项集是许多数据挖掘任务中的关键问题,也是关联规则挖掘算法,所以提高频繁项集的生成效率一直是近几年数据挖掘领域研究的热点之一,研究人员从不同的角度对算法进改进以提高算法的效率。该文提出了一种基于位表的频繁项集挖掘算法,用一种特别的数据结构———位表来压缩数据库以便快速产生候选集和支持计数,实验结果表明;此算法大大减少了遍历的时间,是性能比较好的算法。  相似文献   

3.
频繁模式挖掘是数据挖掘领域中一个重要的研究方向,目前已有很多算法被用于挖掘频繁模式.本文在研究FP-growth算法的基础上,提出一种新的频繁模式挖掘算法——QFP算法.首先对每一个频繁项建立一棵QFP树,进而根据设定的条件对每棵树进行挖掘,直到找出符合条件的频繁模式.实验证明该算法能够减少条件子树的生成数量,降低对内存空间的依赖和CPU的计算时间,从而提高关联规则挖掘的效率.  相似文献   

4.
对多维关联规则中混合维关联规则数据挖掘技术进行了探索,实现了基于多维频繁项集进行多维关联规则数据挖掘的一种实用高效的方法,文中基于多维的频繁项集的挖掘算法主要分为2个步骤,并在高校学生信息系统中给予具体运用.  相似文献   

5.
一种不确定性数据中最大频繁项集挖掘方法   总被引:1,自引:0,他引:1  
不确定性数据挖掘已经成为数据挖掘领域的新热点,频繁项集挖掘是重点研究的问题之一.但是目前出现的挖掘算法大多集中在完全频繁项集,而用于最大频繁项集和频繁闭项集的算法尚不多见.文中研究了一种基于UF-Tree的用于不确定性数据中挖掘最大频繁项集的算法,该挖掘过程分为两个步骤,第一步先得到以频繁1-项集为后缀的局部最大频繁项集,第二步得到所有的全局最大频繁项集,实验证明该算法性能良好且特别适用于稠密型、事务长度较小的数据集.  相似文献   

6.
保持隐私是未来数据挖掘领域的焦点问题之一,如何在不共享精确数据的条件下,获取准确的数据关系是保持隐私的数据挖掘的首要任务.本文利用向量点积方法从垂直型分布数据中挖掘关联规则,并且保持其隐私性.给出了数量积算法和隐私挖掘的步骤,最后举例说明了如何利用数量积算法进行垂直型分布式数据挖掘.  相似文献   

7.
文中提出了一种基于数据仓库和位图连接索引的查询方法.该方法采用高效频集挖掘的数据挖掘技术,建立了一种自动索引选择框架,目的是解决数据仓库的自动管理.实验结果表明,该方法不仅在减少查询响应时间和数据仓库维护成本方面取得明显效果,而且对于其他的索引优化技术也提供了参考.  相似文献   

8.
李忠慧 《科技信息》2009,(24):192-193
在数据挖掘中,关联规则是发现知识的一种有效方法。该文在分析关联规则挖掘Apriori算法原理和性能的基础上,并提出了一种效率更高的改进算法。该算法是基于散列和事务压缩这两种技术。散列技术可以显著地压缩要考察的候选项集,事务压缩可以减少数据库中的事务项,从而提高Apriori算法效率。  相似文献   

9.
从大型事务数据库中发现关联规则是数据挖掘中的一个重要课题,其核心问题是挖掘频繁项集.经典Apriori算法是有效的挖掘频繁项目集的算法.在分析Apriori算法的基础上,提出了一种利用二维数组来代替算法中的哈希树的方法,可以迅速产生二阶频繁项目集,改善了Apriori算法的效率瓶颈,大大提高了算法的执行效率.  相似文献   

10.
数据挖掘关联规则Apriori算法的优化   总被引:3,自引:0,他引:3  
关联规则挖掘研究是数据挖掘研究的一项重要的内容.Apriori算法是挖掘关联规则的经典算法,但存在一些不足之处.本文在Apriori算法基础上,提出了基于链表数据结构的关联规则改进算法.由于该算法只需对交易数据库进行一次检索,故能大量减少所需的I/O次数,提高了系统的性能.  相似文献   

11.
关联规则挖掘是数据挖掘中的一个重要课题,常用的Apriori 算法要多次扫描数据库,会产生大量的候选项集.利用向量的内积运算和逻辑运算提出了一种关联规则挖掘的改进算法.研究表明,该算法运算简单,只需要扫描一次数据库,不需要产生候选项集,且具有处理大型数据库的优点.  相似文献   

12.
文中提出了一种基于数据仓库和位图连接索引的查询方法.该方法采用高效频集挖掘的数据挖掘技术,建立了一种自动索引选择框架,目的是解决数据仓库的自动管理.实验结果表明,该方法不仅在减少查询响应时间和数据仓库维护成本方面取得明显效果,而且对于其他的索引优化技术也提供了参考.  相似文献   

13.
针对使用传统关联规则算法挖掘大数据集时,挖掘过程中效率不高,挖掘出大量冗余规则的问题,提出了基于关联规则和相似度的数据挖掘算法(U-APR):首先,一次性读入数据并构建矩阵,并利用关联规则支持度度量的特性来增加判断属性,以加快结束迭代过程,从而改进了Apriori算法频繁扫描数据库问题;然后,使用相似度算法去除冗余的关联规则;最后,结合置信度、支持度和用户目标匹配度对挖掘结果进行排序输出,从而得到用户感兴趣的关联规则. 同时,应用该算法与目前常用的2种关联规则算法对广东某高校学生财务数据进行数据挖掘. 实验结果表明:与2种常用的关联规则算法相比,U-APR算法缩短了运算时间和提高了存储空间利用率,对用户分析挖掘结果有较好的优化效果.  相似文献   

14.
对云计算技术和数据挖掘进行研究,分析Apriori算法,针对其局限性,提出优化方案,引入云计算中MapReduce模型,实现并行化。提出一种基于MapReduce的频繁项集挖掘方法,以提高算法的运行效率,降低算法执行所需的开销。  相似文献   

15.
基于图的最大频繁项集的生成算法   总被引:1,自引:0,他引:1  
挖掘频繁项集是数据挖掘的重要技术之一,目前已有很多经典算法,如:apriori算法,FP-tree等.挖掘频繁项集主要是寻找最大频繁项集,为了快速寻找最大频繁项集,通常采用削减候选项集、减少扫描数据库次数的方法和将自底向上与自顶向下的搜索方法结合起来(又称双向搜索).双向搜索能有效地缩减搜索空间.本文把基于图的关联规则挖掘和双向搜索的思想结合起来产生最大频繁项集,提出了基于图的最大频繁项集生成算法.此算法用图将数据映射到一个向量上,通过一遍扫描数据库就可以构造整个频繁项集,结合双向搜索,能快速生成频繁项集,对产生较大长度的最大频繁项集也有较好的效果.文末,把基于图的关联规则挖掘算法和基于图的最大频繁项集算法进行了比较,分析出性能差别的原因.  相似文献   

16.
Apriori算法是关联规则挖掘中的经典算法,一直是数据挖掘领域的研究热点。传统的Apriori算法由于产生过多的无用的候选项集以及需要多次扫描数据库导致在一定程度上限制了算法的效率。本文针对这一问题,提出一种新的RF-Apriori算法。该算法首先对数据进行二元处理;然后利用项集的反单调性减少候选项集的产生,从而提高算法效率。实验结果表明,RF -Apriori算法效率明显优于Apriori算法。  相似文献   

17.
关联规则数据挖掘方法的研究   总被引:1,自引:0,他引:1  
在数据挖掘技术中有很多研究领域,关联规则数据挖掘就是其中一个重要的研究方向,对它进行深入研究不仅有着重要的理论意义,而且有着极其重要的应用价值。分析和研究Apriori算法,针对该算法中存在的效率瓶颈问题,提出了一个改进的挖掘算法FDBM_Apriori算法,并实现了该算法。理论和实验证明,FDBM_Apriori算法具有良好的性能。  相似文献   

18.
关联规则挖掘算法研究   总被引:1,自引:0,他引:1  
详细研究了关联规则数据挖掘,分析了存在的问题和不足,提出了一种频繁项集增量算法,用于对Apriori算法进行改进.实验表明,改进算法在运行效率上要比Apriori算法快一个数量级.  相似文献   

19.
频繁项集的挖掘不仅仅是关联规则挖掘的基础,而且在序列模式、聚类、多维模式等数据挖掘任务中扮演重要角色.本文在给出一个基于数据垂直分布的频繁项集挖掘算法HBMFP的基础上,论述了利用MFC中的树视图控件(CTreeCtrl)将频繁项集树形可视化,并讨论了基于该频繁模式树的3种约束频繁项集查询的方法.  相似文献   

20.
从数据挖掘关联规则的性质出发,使用一种简单、实用的基于布尔矩阵的有效挖掘算法,来提高频繁项集的产生效率。阐述了该算法的思想,并将产生关联规则的方法应用于产品销售,快速获取隐含在销售数据库中的有用信息。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号