首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 78 毫秒
1.
简要介绍了关联规则的概念及其基本思想,重点分析和讨论了两个挖掘关联规则的经典算法,即Apriori算法和分段算法。  相似文献   

2.
关联规则Apriori算法的改进   总被引:7,自引:0,他引:7  
Apriori算法是关联规则提取的经典算法,但存在一些不足之处。关联算法的研究主要集中在提高Apriori算法的效率上。本文分析了该算法并进行了改进,使得频繁集产生的同时精简事务集。这种算法及时去掉了不必要的数据,减少了数据运算,从而使算法更优化。  相似文献   

3.
从数据挖掘关联规则的性质出发,使用一种简单、实用的基于布尔矩阵的有效挖掘算法,来提高频繁项集的产生效率。阐述了该算法的思想,并将产生关联规则的方法应用于产品销售,快速获取隐含在销售数据库中的有用信息。  相似文献   

4.
针对Apriori算法存在多次扫描数据库及产生大量候选项集的缺陷,提出了一种改进算法.该算法只需扫描数据库一次,并将事务变换成二进制存储到数据库,可节省存储空间、提高速度.实验结果表明,改进算法挖掘关联规则的效率有较大提高.  相似文献   

5.
挖掘关联规则Apriori算法的一种改进   总被引:1,自引:0,他引:1  
本研究在对Apriori算法分析的基础上,提出了改进的Apriori算法。改进后的算法采用矩阵表示数据库,减少了扫描事物数据库的次数;利用向量运算来实现频繁项集的计数,同时及时地去掉不必要的数据,减少了数据运算,从而提高了算法的运行效率。  相似文献   

6.
目的解决在关联规则挖掘中存在大量无用的候选项集和频繁项集以及效率不高的问题。方法提出了一种基于十字链表的关联规则改进算法。结果利用用户给定的条件和剪枝算法减少了候选项集的数量,再遍历十字链表确定频繁项集,结果表明算法提高了挖掘效率。结论基于十字链表的关联规则改进算法避免了重复扫描数据库,提高了挖掘效率。  相似文献   

7.
针对使用传统关联规则算法挖掘大数据集时,挖掘过程中效率不高,挖掘出大量冗余规则的问题,提出了基于关联规则和相似度的数据挖掘算法(U-APR):首先,一次性读入数据并构建矩阵,并利用关联规则支持度度量的特性来增加判断属性,以加快结束迭代过程,从而改进了Apriori算法频繁扫描数据库问题;然后,使用相似度算法去除冗余的关联规则;最后,结合置信度、支持度和用户目标匹配度对挖掘结果进行排序输出,从而得到用户感兴趣的关联规则. 同时,应用该算法与目前常用的2种关联规则算法对广东某高校学生财务数据进行数据挖掘. 实验结果表明:与2种常用的关联规则算法相比,U-APR算法缩短了运算时间和提高了存储空间利用率,对用户分析挖掘结果有较好的优化效果.  相似文献   

8.
Apriori算法是关联规则的一个重要算法。对关联规则挖掘算法Apriori算法的关键思想以及性能进行了研究,通过对候选项集的属性进行加权运算,减少了产生的频繁集,提高了算法的效率,使算法产生的规则更有应用价值。  相似文献   

9.
频繁项集的生成是关联规则挖掘中的关键问题,本文提出了一种基于无向项集图的频繁项集挖掘算法。应用优化算法对病人就诊数据进行挖掘分析,与传统的频繁项集挖掘算法相比,优化算法在执行效率上有明显的提高,对临床实践研究提供有价值的指导意见。  相似文献   

10.
快速关联规则挖掘算法   总被引:1,自引:0,他引:1  
刘景春 《佳木斯大学学报》2004,22(2):151-156,177
提出了一种新颖的关联规则挖掘算法QAIS,与经典两阶段式关联规则挖掘算法不同的是,它只需扫描一遍事务数据库,不需要生成候选集,并且可以方便的应用在增量式关联规则挖掘算法中,该算法经合成数据验证是有效的.同时针对关联规则生成过程中出现大量冗余规则的问题,还讨论了冗余关联规则去除的问题.  相似文献   

11.
关联规则挖掘Apriori算法的改进及其应用研究   总被引:1,自引:0,他引:1  
在分析经典关联规则挖掘算法的基础上.提出了一种改进的Aprioff关联规则算法.并进行该算法的UCI机嚣学习数据库性能分析和设计电子病历关联规则挖掘应用系统.结果表明该算法在运行速度和挖掘性能上都是高效的.  相似文献   

12.
关联规则挖掘的一个高效预处理算法   总被引:1,自引:1,他引:0  
利用视图机制对原始数据进行预处理,把符合条件的数据和有用的属性放入视图中.根据一维(L1)和二维(L2)中的频繁数据项集对数据库中的属性进行过滤,以达到减少数据属性的目的,从而压缩数据库中的数据,为提高关联规则挖掘算法的性能打下基础.  相似文献   

13.
关联规则数据挖掘方法的研究   总被引:1,自引:0,他引:1  
在数据挖掘技术中有很多研究领域,关联规则数据挖掘就是其中一个重要的研究方向,对它进行深入研究不仅有着重要的理论意义,而且有着极其重要的应用价值。分析和研究Apriori算法,针对该算法中存在的效率瓶颈问题,提出了一个改进的挖掘算法FDBM_Apriori算法,并实现了该算法。理论和实验证明,FDBM_Apriori算法具有良好的性能。  相似文献   

14.
提出一种有效的基于频繁闭项目集的关联规则挖掘算法RIFCI.该算法采用挖掘频繁项目闭集取代传统的频繁项目集,同时在项目集和事务集中展开搜索.通过对UCI机器学习库中10个数据集的测试,与工业标准C4.5比较,错误率低于19.48%,在准确度不变的情况下,生成规则数目低于传统算法,提高了算法的效率.  相似文献   

15.
挖掘大型数据库中的Apriori算法及其改进   总被引:11,自引:2,他引:11  
指出了Apriori算法是一种有效的关联规则挖掘算法,分析和探讨了Apriori算法,并给出了该算法的实现思想,通过实例说明了算法的执行过程,提出了对Apriori算法进行改进的一些方法:散列、事务压缩、划分、选样及动态项集计数。使用这些技术提高了算法的效率。  相似文献   

16.
一种数据挖掘关联规则的高效算法   总被引:4,自引:0,他引:4  
关联规则是数据挖掘的一个重要课题,本文提出了一种新的算法,可以大大减少扫描数据库的次数,能够灵活的在时空两方面取得折衷,提高了效率。  相似文献   

17.
基于约束的关联规则挖掘是针对特定约束的规则的挖掘,挖掘的结果有着更好的针对性和实用性,Separate算法是现有的效果较好的算法,但有2点不足:未修剪生成的候选集和候选项重复生成。对此该文提出了改进的SeparateP算法,算法中加入了对候选集的修剪,并且利用了项集重复生成的信息,使候选集的修剪更加有效快捷。实验表明,改进算法显著提高了原算法的效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号