首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
一种基于关联规则的缺省规则挖掘算法   总被引:2,自引:1,他引:2  
传统的基于Rough集的缺省规则挖掘算法须计算差别矩阵并生成大量的条件属性类,挖掘效率低.为此,本文引入相容关联规则和决策关联规则的概念,提出基于关联规则的缺省规则挖掘算法——DRMBAR,该算法借助FP-tree存储结构挖掘出决策关联规则,并用相容关联规则性质对决策关联规则进行有效修剪后生成相应的缺省规则,DRMBAR可有效地过滤噪声、提高缺省规则挖掘效率,且克服了传统算法依赖于主存的限制,为缺省规则的挖掘提供了一种新的框架。实验结果表明该算法是有效且可行的。  相似文献   

2.
分析了关联规则挖掘的各种算法,详尽分析和探讨了一种用于挖掘关联规则的矩阵算法并给出了矩阵算法实现过程.矩阵算法扫描数据库一次,然后生成事务矩阵,在矩阵上进行相关的数据挖掘操作.当数据库规模较大时,矩阵算法能够显著提高关联规则挖掘的效率.  相似文献   

3.
关联规则挖掘是数据挖掘的一个重要组成部分.为提高关联规则的挖掘效率,提出了一种基于布尔矩阵和MapReduce的FP-Growth算法(BPFP),分析了算法的时间和空间复杂度.该算法使用Hadoop框架和布尔矩阵以减少对事务数据的扫描次数,利用两次MapReduce来实现频繁项集的挖掘.在多个数据集上的实验结果表明,与原FP-Growth算法相比,BPFP算法具有更高的执行效率、更好的加速比.  相似文献   

4.
Apriori算法是当前使用最广泛的关联规则挖掘方法中最为经典的算法之一;但是该算法需要反复的扫描数据库,在L/O上花消很大,并且在得到频繁一2项集的过程中会产生庞大的候选一2项集,其次在筛选得到频繁一k项集时,并没排除那些不应该参组合的元素,而导致该算法效率很低,针对上面影响计算效率的三个方面提出基于压缩事务矩阵相乘得到频繁项目集的算法,只需一次扫描数据库,经过压缩处理产生产生事务矩阵,通过矩阵间运算得到频繁项目集,有效提高了关联规则的挖掘效率。  相似文献   

5.
黄丽嫦 《科学技术与工程》2012,12(15):3626-3629,3635
分析了矩阵的LU分解原理,并在双核微机上设计实现了一种矩阵的LU并行递归分解算法.该算法的特点是引入分块矩阵把LU分解形成迭代递归的形式,进而较好地发挥了新型微机的并行运算和高速缓冲存储器的功能.实验结果表明该算法是可行和有效的.  相似文献   

6.
随着大数据时代的到来,增量关联规则挖掘已成为数据挖掘领域的热门话题.CAN-tree作为增量关联规则挖掘领域的重要算法,其按项目频次大小进行排序会使树(tree)的规模过大,降低算法效率.针对此问题,提出一种基于AP-CAN的增量关联挖掘算法,采用AP聚类思想将原始数据集按项目的支持度不同分为多个集群,修剪不满足最小支持度的集群,利用哈希头表替代项头表,并根据数据量对每条事务排序.实验结果表明,该方法可以显著削减CAN树的规模,降低项目查找时间,提高数据挖掘效率,在效率和稳定性上均优于现有的CAN-tree算法.  相似文献   

7.
在基于多块同位网格和集群以突扩管路系统内部流场为算例开展的分区并行计算研究中,利用SIMPLE算法实施了可自定义分区的并行计算方法,分析了不同雷诺数和突扩比对突扩管内流动结构的影响,重点探讨了基于自定义分区的不同分区方式及核数工况下集群的并行计算效率,进一步分析负载对计算效率的影响.结果表明,网格数、核数和分区方式对集群的计算效率都有很大的影响,并且每个分区所包含的网格数越均匀即负载越均衡,并行计算效率越高.  相似文献   

8.
云计算技术是海量数据挖掘的一种高效解决方案,将MapReduce并行计算模型与粗糙集属性约简算法相结合,提出一种基于MapReduce的浓缩布尔矩阵并行属性约简算法.该算法提高了粗糙集属性约简算法对大数据的处理能力和效率,并能适应云计算环境.实验结果表明,所提算法具有良好的效率、加速比和可扩展性.  相似文献   

9.
针对Apriori-Hybrid算法的瓶颈,提出了一种使用支持度矩阵对频繁2项集快速挖掘的方法,采用改进的Apriori-Hybrid算法来挖掘关联规则,试验证明该算法提高了关联规则挖掘的效率和质量.  相似文献   

10.
一种扩展的关联规则挖掘算法   总被引:2,自引:1,他引:1  
提出一种扩展的关联规则挖掘算法, 该算法扩展了传统 算法都是针对二元数据矩阵的缺点, 引入了挖掘量化的关联规则, 通过试验发现, 该算法同样适用于传统的布尔矩阵. 该算法主要是基于主成分分析法发现数据中特征向量的思想来挖掘数据中的量化关联, 同时定义了比例项目集. 该算法在时空复杂性上也取得了较好的效果  相似文献   

11.
文章在分析已有并行关联规则挖掘算法的基础上,讨论了多处理器系统中影响并行关联规则挖掘算法性能的主要问题。提出了多数据源在集群系统中的分布策略、在集群系统中进行并行关联规则挖掘的过程与策略、挖掘过程中并行计算的模型与方法以及规则的合并机制。  相似文献   

12.
时态关联规则研究与应用   总被引:4,自引:0,他引:4  
传统关联规则挖掘很少考虑关联规则的时间适用性.时态关联规则是指带有时态约束的关联规则,每个关联规则都有着其成立的时间区域.结合其他算法的特点,提出了基于Fisher聚类的时态关联规则挖掘算法(TApriori算法),它能够动态地发现关联规则以及关联规则有效的时间区域.实验结果证明该算法是合理有效的.最后,结合具体CRM项目的特点,讨论了在CRM引入数据挖掘的体系结构,给出了一个应用.  相似文献   

13.
张俊 《长春大学学报》2014,(12):1666-1670
首先简单介绍了几种经典的数据挖掘领域的算法,考虑到这些算法的优缺点及其应用领域,本文采用关联规则挖掘算法。由于Apriori算法的各种变形可用于提高算法效率和可伸缩性,最后选择采用单维单层布尔型的关联规则的Apriori算法。本文对Apriori算法进行了扼要的介绍,并根据其算法的原理详细地设计了基于Web的分布式数据挖掘隐私保护方法。  相似文献   

14.
关联规则是数据挖掘中的一个重要研究方向.经典的Apriori算法是一种最有影响的挖掘布尔型关联规则频繁项集的算法,但其并不适合挖掘近年来兴起的多维数据模型.在改进Apriori算法的基础上,提出了一种"二次剪枝"的算法,此算法适用于挖掘多维关联规则,并且在一定程度上提高了算法效率.  相似文献   

15.
hldirect association is a high level relationship between items and frequent itemsets in data. Current research approaches on indirect association mining are limited to indirect association between itempairs,which will discover too many rules from dataset. A formal definition of indirect association between multiple items is presented, along with an algorithm, SET NIA, for mining this kind of indirect associations based on anti-monotonicity of indirect associations and frequent itempair support matrix. While the found rules contain same information as compared to the rules found by indirect association between itempairs algorithms, this notion brings space-saving in storage of the rules as well as superiority for human to understand and apply the ndes. Experiments conducted on two real-word datasets show that SET _ NIA can effectively find fewer rules than existing algorithms which mine indirect association between itempairs,the experimental results also prove that SET_NIA has better performance than existing algorithms.  相似文献   

16.
针对分布式数据库和约束条件的特点,提出了2种在分布式环境下挖掘约束性关联规则的有效算法,即基于Apriori算法的DMAIC算法和基于频繁模式树的DAMICFP算法.此外,进行了实例验证和测试分析,指出了这2种算法各自的优缺点及适用条件.研究结果表明:DMAIC算法可靠性高,通信协议简单,适用于对通信性能要求不高的分布式数据库;DAMICFP算法执行效率高,通信性能好,适用于对通信性能要求较高的多项目分布式数据库;这2种算法均能有效地解决分布式挖掘约束性关联规则的问题.  相似文献   

17.
关联规则挖掘寻找给定数据集中项之间的有趣关系,是数据挖掘的主要研究方面.传统的关联规则挖掘算法仅能挖掘正关联规则,事实上,负关联规则也包含了非常有价值的信息,对于决策的作用也是不容忽视的.  相似文献   

18.
关联规则Apriori算法的改进   总被引:7,自引:0,他引:7  
Apriori算法是关联规则提取的经典算法,但存在一些不足之处。关联算法的研究主要集中在提高Apriori算法的效率上。本文分析了该算法并进行了改进,使得频繁集产生的同时精简事务集。这种算法及时去掉了不必要的数据,减少了数据运算,从而使算法更优化。  相似文献   

19.
聚类多维数字属性的关联规则   总被引:1,自引:1,他引:0  
提出一种有效开采多维数字属性关联规则的算法。为解决返回规则太多的问题,利用聚类技术把开采出来的关联规则进行分类,从而使所开采的规则量显著减少,同时使得结果更易理解。  相似文献   

20.
基于模式矩阵的FP-growth改进算法   总被引:10,自引:0,他引:10  
数据挖掘中关联挖掘算法比较典型的有Apriori和FP—growth算法.实验和研究证明FP—growth算法优于Apriori算法.但是针对大型数据库这两种算法都存在着较大缺陷,不仅要两次或多次扫描数据库,而且很难处理支持度和数据变化等关联规则更新问题.作者提出了基于模式矩阵的FP—growth改进算法,它至多扫描数据库一次,特别在更新问题上不用重新扫描数据库.通过实验结果分析,验证了这种改进算法相对于原有FP—growth算法的优势,特别在大数据集下,大大降低了挖掘的时间复杂度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号