首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
Apriori算法是一种经典的基于关联规则的数据挖掘算法,在研究Apriori算法及其现有改进方法的基础上,提出了一种全新的从高维向低维扫描的Apriori改进算法,并与传统Apriori算法进行比较分析。结果表明该改进算法可有效地减少数据库扫描时间和额外空间占有量。  相似文献   

2.
频繁项集的挖掘效率是关联规则产生的关键.针对经典Apriori算法的瓶颈,提出一种改进算法,通过数组结构来保存项集信息,只须扫描一遍数据库减少了时间开销.在自连接前进行项目计数,减少参加连接的项集数量,减少了候选项集的数量.通过实例证明,改进算法的效率更高.  相似文献   

3.
针对传统的关联分析算法Apriori执行效率低、I/O过重、计算量过大等问题,提出了一种通过减少扫描数据库次数来降低候选项集计算复杂度, 在频繁项集求解过程中通过将事务项集转换为行向量,利用“与”操作来提高算法执行效率的Apriori改进算法。利用学生在校行为数据集对Apriori改进算法进行有效性和高效性验证。同时,为了符合算法对样本数据的要求,在样本数据处理过程中对原始数据进行了清洗和离散化处理,定义了分析对象的样本数据离散化处理的规则。通过实验分析比较了Apriori改进算法与经典Apriori算法的性能。结果表明,Apriori改进算法保持了对实际分析对象关联规则挖掘的有效性,同时具有更高的执行效率。  相似文献   

4.
挖掘关联规则Apriori算法的一种改进   总被引:1,自引:0,他引:1  
本研究在对Apriori算法分析的基础上,提出了改进的Apriori算法。改进后的算法采用矩阵表示数据库,减少了扫描事物数据库的次数;利用向量运算来实现频繁项集的计数,同时及时地去掉不必要的数据,减少了数据运算,从而提高了算法的运行效率。  相似文献   

5.
为了指导质量管理过程的持续改进,提出了基于图结构的工作流频繁活动序列模式的挖掘方法.采用基于Apriori方法的频繁活动序列挖掘算法,认为k-频繁图集中,当一个图减去其中的一个源顶点后,如果所得到的图与另一个图减去其中的一个沉顶点后的图相同时,可以连接生成一个(k+1)-候选频繁图,从而减少了传统Apriori算法迭代过程中生成的冗余候选频繁图的数目.文中以某飞机制造公司的质量外审意见处理流程为例,对改进Apriori算法的应用效果进行了验证,结果表明,该方法能够有效地挖掘出历史过程实例集中所蕴含的频繁活动执行序列,辅助企业可从过程组成的角度来寻找质量管理过程的改进机会.  相似文献   

6.
在分析当前Apriori算法及其改进算法的基础上,提出了一种将Apriori算法与物流信息挖掘相结合的Apriori改进算法.通过Apriori改进算法与原Apriori算法挖掘结果的比较,说明了Apriori改进算法不仅缩小了剪枝扫描数据库的规模而且减少了生成频繁项目集的候选项目集.  相似文献   

7.
本文分析了关联规则的经典算法Apriori算法,对该算法存在的不足进行了讨论,针对这些不足介绍了一些主要的算法改进方法和思路,并提出了一种基于矩阵的Apriori改进算法,通过减少对数据库的操作来提高效率。  相似文献   

8.
本文分析了关联规则的经典算法Apriori算法,对该算法存在的不足进行了讨论,针对这些不足介绍了一些主要的算法改进方法和思路,并提出了一种基于矩阵的Apriori改进算法,通过减少对数据库的操作来提高效率.  相似文献   

9.
为了解决Apriori 算法的不足,提出了改进的Apriori算法:进行剪枝侯选项目集时,采用生成频繁项目集和删除具有非频繁子集候选同时进行的方法来减少多余子项目集的生成.改进的Apriori 算法大大提高了频繁项目集即关联规则生成的效率,运行时间不及原算法的十分之一,同时节省了大量的存储空间.最后利用改进的Apriori 算法对中医医案数据进行关联规则挖掘,获得了良好的效果.  相似文献   

10.
基于SQL的Apriori改进算法研究   总被引:1,自引:0,他引:1  
为了减少传统的Apriori算法在数据库应用中生成错误规则和大量无关项集,造成对空间的浪费而且运算的周期也较长的问题,本文提出了一种基于SQL的Apriori改进算法,通过引入提升度的概念,从根本上大大剪枝关联规则和无关项集.经过算例实际测试表明,在实测运算中缩短了Apriori算法的运算时间,提高了查询精度,减少了大量的无关项集,从而证实了论文所提出的Apriori改进算法是正确与有效的.  相似文献   

11.
廖孟柯  樊冰  李忠政  付林  舒楠 《科学技术与工程》2021,21(24):10381-10386
影响配电网设备提前退役的因素复杂多样,而且多种因素之间互相作用。为了筛选出影响设备提前退役的主要因素候选集,可以利用数据挖掘算法得到其中关联规则。其中,Apriori算法是最经典的挖掘关联规则的算法。但是传统的Apriori算法时间复杂度过大,计算效率不高。针对这一现状,提出一种基于三维矩阵的Apriori优化算法,通过建立三维矩阵以及简约数据库的方式,减少了传统算法中的计算冗余,挖掘出影响配电网设备提前退役的因素频繁项集。结果表明:改进算法能够得到配电网设备退役因素的关联规则并明显提高计算效率。  相似文献   

12.
提出一种从大型数据库中挖掘关联规则的快速算法——自适应快速关联规则提取算法。该算法以经典的Apriori算法及其他各种优化算法为基础,引入了自适应步长和扫描树的概念,并采用修剪法对Apriori算法进行了改进。理论分析与实验结果表明,该算法比Apriori算法的应用效率高,同时也证实了其有效性。  相似文献   

13.
在分析已有关联规则和挖掘算法的基础上,对频集发现算法Apriori进行了研究,详细地论述了该算法的实现过程及所涉及的诸多问题,并对该算法的缺点及如何优化进行了较为深入的讨论.  相似文献   

14.
关联规则Apriori算法的改进   总被引:7,自引:0,他引:7  
Apriori算法是关联规则提取的经典算法,但存在一些不足之处。关联算法的研究主要集中在提高Apriori算法的效率上。本文分析了该算法并进行了改进,使得频繁集产生的同时精简事务集。这种算法及时去掉了不必要的数据,减少了数据运算,从而使算法更优化。  相似文献   

15.
在分析Apriori算法的基础上,介绍了该算法的C语言实现,包括频繁集的发现和关联规则的生成,为进一步研究关联规则提供了基础。  相似文献   

16.
张俊 《长春大学学报》2014,(12):1666-1670
首先简单介绍了几种经典的数据挖掘领域的算法,考虑到这些算法的优缺点及其应用领域,本文采用关联规则挖掘算法。由于Apriori算法的各种变形可用于提高算法效率和可伸缩性,最后选择采用单维单层布尔型的关联规则的Apriori算法。本文对Apriori算法进行了扼要的介绍,并根据其算法的原理详细地设计了基于Web的分布式数据挖掘隐私保护方法。  相似文献   

17.
Apriori是挖掘关联规则最经典的算法之一,针对该算法存在的瓶颈问题研究了基于MapReduce编程框架的简单Apriori并行算法;并在简单Apriori并行算法的基础上提出一种采用固定多阶段结合挖掘策略的改进算法——多阶段并行算法。实验结果表明,改进算法能缩短挖掘时间,提高执行的效率。  相似文献   

18.
随着数据库规模的日益增大,关联规则挖掘需要在挖掘效率、可用性、隐私性及精确性等方面得到提升,需要对传统的关联规则挖掘算法进行更新和改进。在传统的Apriori算法基础上,提出了一种新的在关系数据库中挖掘关联规则的算法。该算法只需扫描一次数据库即可得到频繁项集,并通过非频繁项集来减少候选项集的生成,从而提高了算法的运算效率;此外,该算法将包含敏感数据事务做相关的处理,以达到隐藏包含敏感数据的关联规则。理论分析和实验结果表明,新算法不仅提高了关联规则挖掘的效率,而且还达到了隐藏包含敏感规则的目的。  相似文献   

19.
设计了一种不同于传统关联规则挖掘算法(如Apriori算法等)频繁项集产生算法.该算法借鉴一般免疫算法思想,并从新的角度来看频繁项集的定义,避免了传统算法中存在的"项集生成瓶颈"问题.通过对mushroom数据的频繁项集挖掘的实验,与传统方法进行了比较,其结果表明,基于免疫算法的频繁项集挖掘算法在大数据集、低支持度情况下平均挖掘时间短.  相似文献   

20.
由于传统的Apriori算法是串行的并且效率较低,分析了Apriori算法的计算过程,针对其原理设计了一种基于Mapreduce的并行Apriori改进算法.实验结果证明,改进的算法能较好地提高关联规则挖掘的效率,具有接近线性的加速比和良好的应用价值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号