共查询到20条相似文献,搜索用时 78 毫秒
1.
在对分布式关联规则挖掘的三种主要算法:CD算法、DD算法及FD算法的原理及实现步骤进行详细的阐述的基础之上,得出其各自的优缺点,并指出FD算法在网络通信效率和算法灵活性方面更具有优越性。 相似文献
2.
介绍了由ChristianHidber提出的在线挖掘关联规则算法Carma,提出了该算法的若干改进,减弱了原算法第一步有交易的子集v被插入集合V的条件,同时改进了maxMissed的计算公式,使其计算更为简单。实验证明,以上改进提高了算法的速度。 相似文献
3.
在相关矩阵理论的研究基础上,将网格与Web服务技术融合,以分布式问题求解环境和开源数据挖掘类库weka为底层支撑,构建了网格环境下面向服务的分布式数据挖掘体系,提出一种基于矩阵的分布式关联规则算法.该算法不需要进行复杂的寻找频繁项集的过程,直接通过关联矩阵就可以判断出,给出了算法的理论证明,并通过实例验证了算法的正确性、有效性和体系结构的可行性,对于解决分布式关联规则挖掘问题有了一个新的突破. 相似文献
4.
关联规则挖掘Apriori算法研究 总被引:1,自引:0,他引:1
随着收集和存储在数据库中的数据规模越来越大,人们对从这些数据中挖掘出相应的联知识愈来愈感兴趣,关联规则一个典型的应用实例就是市场购物分析.本文介绍了关联分析的概念Apriori算法及其改进技术,对Apriori算法地优缺点进行了评价. 相似文献
5.
一种改进的负关联规则挖掘算法 总被引:6,自引:0,他引:6
负关联规则A→—B(或者-A→B,-A→B)描述的是项目之间的互斥关系,其与传统的关联规则有着同样重要的作用.然而,负关联规则和传统正关联规则的挖掘有很大不同,因为负关联规则隐藏在数量巨大的非频繁项集中.因此提出一种新的挖掘horn子句类型负关联规则的算法,并且实验证明是行之有效的. 相似文献
6.
从大型事务数据库中发现关联规则是数据挖掘中的一个重要课题,其核心问题是挖掘频繁项集.经典Apriori算法是有效的挖掘频繁项目集的算法.在分析Apriori算法的基础上,提出了一种利用二维数组来代替算法中的哈希树的方法,可以迅速产生二阶频繁项目集,改善了Apriori算法的效率瓶颈,大大提高了算法的执行效率. 相似文献
7.
一种基于关联规则的缺省规则挖掘算法 总被引:2,自引:1,他引:2
传统的基于Rough集的缺省规则挖掘算法须计算差别矩阵并生成大量的条件属性类,挖掘效率低.为此,本文引入相容关联规则和决策关联规则的概念,提出基于关联规则的缺省规则挖掘算法——DRMBAR,该算法借助FP-tree存储结构挖掘出决策关联规则,并用相容关联规则性质对决策关联规则进行有效修剪后生成相应的缺省规则,DRMBAR可有效地过滤噪声、提高缺省规则挖掘效率,且克服了传统算法依赖于主存的限制,为缺省规则的挖掘提供了一种新的框架。实验结果表明该算法是有效且可行的。 相似文献
8.
一种高效并行关联规则挖掘新算法 总被引:1,自引:0,他引:1
提出了一种在微机集群上实现的高效并行算法。该算法利用矩阵理论中上三角矩阵的良好性质,通过数据库约简、投影等操作,在微机集群的各节点上开展并行挖掘,从而提高挖掘算法的效率和可扩性。在微机集群上的实验证明,该算法能大大提高关联规则的挖掘效率,并具有良好的可扩性。 相似文献
9.
10.
在Apriori算法基础上,给出一个改进的关联规则挖掘算法。改进的算法只需对数据库进行一次搜索,能大量减少L/O次数,且内存开销适中。通过一组实验对两种算法进行比较,本算法尤其对大型数据库的性能优于先前已有的一些关联规则算法。 相似文献
11.
12.
一种高效相联规则提取算法 总被引:3,自引:0,他引:3
在 Apriori 算法基础上, 提出改进算法 Apriori Pro. 利用中间结果对数据库进行过滤,从而加快候选项集的计数速度, 提高了整个算法的效率. 相似文献
13.
关联规则发现的一种改进算法 总被引:7,自引:0,他引:7
在Apriori算法基础上,给出一个改进的关联规则发现算法·由于这个算法只需对交易数据库进行一次搜索,能大量减少所需的I/O次数,且内存开销适中,因此同其他关联规则发现算法相比具有快速的优点,适合于大型交易数据库·使用合成数据作试验表明这个算法尤其对大型数据库的性能优于先前已有的一些关联规则算法· 相似文献
14.
基于支持格的关联规则挖掘算法 总被引:1,自引:0,他引:1
提出了一种基于支持格的关联规则挖掘算法(ARSL),该算法连续扫描数据库事务序列,逐步构造支持格,对数据库扫描不超过2遍即可求得所有大项目集。首次扫描数据库时,能提供反馈信息,允许用户对最小支持率进行调整。该算法能连续处理事务序列,可用于网上在线数据挖掘。 相似文献
15.
一种基于改进型遗传算法的关联规则提取算法及其应用 总被引:3,自引:0,他引:3
对关联规则的数据挖掘和遗传算法进行了概述,阐述了关联规则数据挖掘的现实意义,提出了一种采用改进型遗传算法的关联规则提取方法,并给出了具体的算法,最后结合一个具体实例进行了应用。 相似文献
16.
17.
一种基于限制的关联规则数据开采的算法 总被引:2,自引:1,他引:1
针对海量数据库开采时,现有的关联规则算法效率非常低下的问题,提出一种附加最小保证度的限制,并在此基础上提出一种新开采算法,可减少频繁项目集的数量,并显著地降低I/O时间和CPU时间。 相似文献
18.
关联规则的高效向量法数据挖掘 总被引:1,自引:0,他引:1
对经典的向量挖掘算法和Apriori算法的思想及其复杂度进行分析后,提出了一种新的高效向量数据挖掘算法。新算法通过避免不必要的计算以达到提高算法的计算效率,通过避免不必要的存贮以达到减少算法的空间复杂度,与经典的向量挖掘算法相比有如下优点:(1)空间复杂度为o(n|L1|),比经典的挖掘算法的空间复杂度要小得多;(2)计算量比经典的挖掘算法要小。 相似文献
19.
提出了在分布式环境下对于每一层使用不同支持度的时态关联规则挖掘问题及其算法DMARM。该算法使用轮询方法处理分布式系统中各个节点间的通讯问题,在各个节点上利用集合“或”和“与”运算,在求候选频繁模式的同时求出了模式的支持度,减少了数据库的扫描次数。 相似文献
20.
针对分布式数据库和约束条件的特点,提出了2种在分布式环境下挖掘约束性关联规则的有效算法,即基于Apriori算法的DMAIC算法和基于频繁模式树的DAMICFP算法.此外,进行了实例验证和测试分析,指出了这2种算法各自的优缺点及适用条件.研究结果表明:DMAIC算法可靠性高,通信协议简单,适用于对通信性能要求不高的分布式数据库;DAMICFP算法执行效率高,通信性能好,适用于对通信性能要求较高的多项目分布式数据库;这2种算法均能有效地解决分布式挖掘约束性关联规则的问题. 相似文献