共查询到20条相似文献,搜索用时 15 毫秒
1.
一种改进的Apriori算法 总被引:1,自引:0,他引:1
Apriori算法存在许多可以改进的地方.例如它需要反复读取数据库,并且读取的次数由项目集中的项目个数来确定,I/O负载与最大项目集的项数成正比.本文提出一种只读一次数据库的的改进算法. 相似文献
2.
介绍了关联规则挖掘的情况,并在分析关联规则的数据挖掘算法的基础上,提出一个改进的Apriori算法.新算法仅对数据库扫描一次,就能找出所有的频繁项集,从而提高了挖掘的效率,具有一定的实用性 相似文献
3.
4.
挖掘关联规则Apriori算法的一种改进 总被引:1,自引:0,他引:1
本研究在对Apriori算法分析的基础上,提出了改进的Apriori算法。改进后的算法采用矩阵表示数据库,减少了扫描事物数据库的次数;利用向量运算来实现频繁项集的计数,同时及时地去掉不必要的数据,减少了数据运算,从而提高了算法的运行效率。 相似文献
5.
Apriori算法是关联规则挖掘中最经典的算法,但它存在两大致命缺陷:需多次扫描数据库和产生海量的候选项目集。从这两个角度出发改进算法,提出了一种基于模式矩阵的高效改进算法(简称P-Matrix算法),使扫描数据库的次数减少为一次,同时不产生候选项目集而直接产生频繁项目集,从而使算法的时间复杂度和空间复杂度大大减少,有效地提高了Apriori算法的效率。 相似文献
6.
关联规则Apriori算法自提出以来,有很多的改进算法,但大多是在改变最小支持度的大小,这样虽可提高Apriori算法的速度,但会漏掉一些有用的项集.本文结合以上问题,用一种科学的方法求出最小支持度,并在提取频繁项集的过程中动态地改变最小支持度的值,有效地解决了以上问题,提高了Apriori算法的效率. 相似文献
7.
针对Apriori算法存在多次扫描数据库及产生大量候选项集的缺陷,提出了一种改进算法.该算法只需扫描数据库一次,并将事务变换成二进制存储到数据库,可节省存储空间、提高速度.实验结果表明,改进算法挖掘关联规则的效率有较大提高. 相似文献
8.
关联规则是数据挖掘的一个重要研究内容,主要用于从大量数据集中挖掘出有价值的数据项之间的关联关系.典型案例是超市的购物篮分析,主要对顾客的购买记录数据库进行关联规则挖掘,可以发现顾客的购买行为.本文依据Apriori算法的两个基本性质,即任何大项集的子集一定是大项集,非大项集的超集一定是非大项集,对经典的Apriori算法要多次扫面事务数据库的问题,作了一些改进,并进行仿真计算,结果表明,改进的算法确实减少了扫描次数. 相似文献
9.
试卷评估是教学工作中非常重要的一部分,针对传统试卷评估方法中仅仅是对试卷进行宏观整体的分析与评价,缺乏对试卷的微观分析.文章将一种高效的改进的Apriori算法应用在试卷分析中,挖掘出知识点之间的关联,得到的结论对于教师改进教学方法、优化教学效果,提高命题水平和试卷质量对有巨大的指导作用,对于学生有针对性的学也具有巨大的指导作用,同时对于教学管理部门的决策提供了理论依据. 相似文献
10.
随着精准扶贫建档立卡工作的实施,精准扶贫系统已积累了大量数据,利用高效的关联规则算法挖掘其中隐含的有用信息对助力精准扶贫工作具有重要意义。本文针对贫困户建档立卡数据的数据重复率高,属性多样特点,提出一种改进的Apriori算法,利用对矩阵的数据结构和集合的相关性质来构建候选项集,避免重复扫描数据库以及逐层的剪枝连接运算,提高算法挖掘效率;通过对实际贫困户建档立卡数据进行挖掘,证明了该算法在最小支持度阈值较低的条件下挖掘效率优于传统Apriori算法。 相似文献
11.
关联规则Apriori算法的改进 总被引:7,自引:0,他引:7
杨晓平 《浙江海洋学院学报(自然科学版)》2006,25(2):176-182,195
Apriori算法是关联规则提取的经典算法,但存在一些不足之处。关联算法的研究主要集中在提高Apriori算法的效率上。本文分析了该算法并进行了改进,使得频繁集产生的同时精简事务集。这种算法及时去掉了不必要的数据,减少了数据运算,从而使算法更优化。 相似文献
12.
段明秀 《沈阳师范大学学报(自然科学版)》2008,26(4)
介绍了一种关联规则挖掘中Apriori算法的改进算法.这种方法允许数据近似匹配模式,从而提高模式的整体支持度.这种方法对含有空缺数据的关联规则挖掘同样有用,使得空缺数据也能增加模式的支持度.最后,用样例数据库来说明了改进算法的效用. 相似文献
13.
Apriori算法是经典的数据挖掘算法之一,它根据置信度和支持度对产生的频繁集进行选择,找出强规则.传统的Apriori算法需要产生大量的侯选集和多次数据库的扫描,存储和通信的开销巨大.云计算环境可以解决存储问题,所以针对Mapreduce的编程框架,提出一种适用于此模式的新关联规则算法,解决传统Apriori算法时间和空间上的缺点,提高挖掘效率. 相似文献
14.
关联规则Apriori改进算法 总被引:1,自引:0,他引:1
在分析关联规则和Apriori算法原理的基础上,针对Apriori算法瓶颈提出一种改进算法,该算法直接产生项数最大频繁项目集.改进算法访问的数据量明显减少,尤其适用于只寻找项数最大的频繁项目集的情况,尤其适用于稀疏数据.实验结果表明改进算法提高了算法效率,改善了算法的性能. 相似文献
15.
关联规则Apriori算法改进研究与应用 总被引:1,自引:0,他引:1
为改进关联规则Apriori算法,首先对数据库中数据存储方法进行了变换,进一步简化为二进制存储并求得了项数最大的频繁项目集,实验研究结果表明.改进后算法效率明显提高.性能得到优化;同时,利用改进后的算法挖掘出学科中联系紧密的知识点潜在的规律,结论运用到教学中去可以有效的提高学科教学质量.本方法同样可以借鉴到其它学科课程或课程群中知识点规律挖掘中去. 相似文献
16.
关联规则挖掘Apriori算法研究 总被引:1,自引:0,他引:1
随着收集和存储在数据库中的数据规模越来越大,人们对从这些数据中挖掘出相应的联知识愈来愈感兴趣,关联规则一个典型的应用实例就是市场购物分析.本文介绍了关联分析的概念Apriori算法及其改进技术,对Apriori算法地优缺点进行了评价. 相似文献
17.
Apriori算法是一种经典的基于关联规则的数据挖掘算法,在研究Apriori算法及其现有改进方法的基础上,提出了一种全新的从高维向低维扫描的Apriori改进算法,并与传统Apriori算法进行比较分析。结果表明该改进算法可有效地减少数据库扫描时间和额外空间占有量。 相似文献
18.
通过对Apriori和1-k-Apriori两种算法进行细致分析和深入研究,结合这两种算法的优点,提出了I1-k-Apriori算法.1-k-Apriori算法中利用Lk-1与L1相连接来得到候选项目集,但是,有些情况下,用这种方法生成的候选k项集数量过大,导致k项集的筛选代价太大.I1-k-Apriori算法根据k-1项集的特性和事务数据库中数据的特性来决定产生k项集的方法,可以有效避免由于Lk项数过多而影响运算效率.实验结果表明,I1-k-Apriori算法较大提高了运算效率. 相似文献
19.
基于SQL的Apriori改进算法研究 总被引:1,自引:0,他引:1
为了减少传统的Apriori算法在数据库应用中生成错误规则和大量无关项集,造成对空间的浪费而且运算的周期也较长的问题,本文提出了一种基于SQL的Apriori改进算法,通过引入提升度的概念,从根本上大大剪枝关联规则和无关项集.经过算例实际测试表明,在实测运算中缩短了Apriori算法的运算时间,提高了查询精度,减少了大量的无关项集,从而证实了论文所提出的Apriori改进算法是正确与有效的. 相似文献
20.
钟晓桢 《江汉大学学报(自然科学版)》2007,35(3):59-63
在数据库中挖掘关联规则是数据挖掘领域的一个重要的研究课题,在应用中具有非常重要的意义.在分析Apriori算法和IUA算法经典关联规则挖掘算法的基础上,提出了一种基于最近挖掘结果的更新算法称为IIUA.IIUA算法吸收了Apriori算法和IUA算法的优点,在改变最小支持度和基于最近挖掘结果的条件下,从生成尽可能少的候选项集考虑,得到完整的新频繁项集,从而提高算法的效率. 相似文献