共查询到19条相似文献,搜索用时 78 毫秒
1.
关联规则挖掘算法研究 总被引:1,自引:0,他引:1
详细研究了关联规则数据挖掘,分析了存在的问题和不足,提出了一种频繁项集增量算法,用于对Apriori算法进行改进.实验表明,改进算法在运行效率上要比Apriori算法快一个数量级. 相似文献
2.
关联规则的挖掘往往会产生大量的关联规则,"规则爆炸"的问题会使用户很难得到自己所需要的重要信息.极大布尔关联规则集因其包含的规则数量少且不丢失规则信息的优点提高了用户分析关联规则结果的效率,且节省了规则存储空间.在分析频繁闭项集、频繁基项集和极大布尔关联规则性质的基础上提出了一种挖掘极大布尔关联规则的算法,利用此算法可以得到极大布尔关联规则集,还通过实例验证了算法的正确性. 相似文献
3.
提出了基于数组的关联规则挖掘算法,该算法只扫描一次数据库,将数据库中的数据存于数组中,提高了内存的利用效率,同时也提高了算法效率. 相似文献
4.
5.
基于有向图的关联规则挖掘算法研究 总被引:2,自引:0,他引:2
为了提高关联规则挖掘效率,提出了一种基于有向图的频繁项目集挖掘算法DGBFIG(Directed graph -based frequent itemsets generation).该算法采用位矢量技术构造有向图,表示项与项之间的频繁关系,并在有向图的基础上递归产生频繁项集,从而只需扫描数据库2次,不产生候选集,从而大大提高了关联规则挖掘算法的效率.最后从空间和时间的复杂度分析了该算法的效率. 相似文献
6.
关联规则的发现对于挖掘数据中的隐含信息非常重要,针对关联规则挖掘算法进行研究,分析了利用FP_Growth算法构建FP-tree和递归挖掘频繁项集的过程,并应用该算法对大学生兴趣爱好问卷调查结果进行分析,通过找出强关联规则,准确了解学生的共同爱好,有助于更好地开展校园文化活动. 相似文献
7.
快速关联规则挖掘算法 总被引:1,自引:0,他引:1
提出了一种新颖的关联规则挖掘算法QAIS,与经典两阶段式关联规则挖掘算法不同的是,它只需扫描一遍事务数据库,不需要生成候选集,并且可以方便的应用在增量式关联规则挖掘算法中,该算法经合成数据验证是有效的.同时针对关联规则生成过程中出现大量冗余规则的问题,还讨论了冗余关联规则去除的问题. 相似文献
8.
基于数据库约简的关联规则挖掘算法 总被引:7,自引:0,他引:7
通过对Apriori算法挖掘过程进行分析,提出了一种基于数据库约简的关联规则挖掘算法.该算法利用每趟挖掘中一些非频繁项集的超集、并集,逐步约简事务数据库中的事务,提高了关联规则的挖掘效率.在这些非频繁项集的基础上建立了数据库约简的定理和推论,并在Apriori算法的基础上设计了ApioriNEW算法.经过对算法进行分析和实验,算法ApioriNEW的挖掘效率比较高.一般情况下,平均可将挖掘效率提高约30%.ApioriNEW算法特别适合大型数据库的关联规则挖掘,已应用在网络故障诊断专家系统的知识获取中. 相似文献
9.
频繁项集的挖掘效率是关联规则产生的关键.针对经典Apriori算法的瓶颈,提出一种改进算法,通过数组结构来保存项集信息,只须扫描一遍数据库减少了时间开销.在自连接前进行项目计数,减少参加连接的项集数量,减少了候选项集的数量.通过实例证明,改进算法的效率更高. 相似文献
10.
唐德权 《湖南文理学院学报(自然科学版)》2006,18(3):72-74,79
关联知识挖掘算法中一种广为人知的算法就是Aprior算法,之后所有关联规则挖掘算法的基本思想都是基于频繁项目集发现算法的基础上进行了改进.为了提高关联规则挖掘效率,首先回顾了基于图的关联规则挖掘算法;然后,在此基础上进行了改进,把关联规则挖掘中寻找频繁项集的问题转换为图中寻找完全子图的问题,通过在图中查找完全子图来寻找频繁项集.提出了一种基于图的关联规则挖掘改进算法,并且对原算法和改进的算法从时间和空间的性能进行了比较分析,得出改进的算法是有效可行的.最后从实验结果得出结论GenerateItemsets算法比DGBFIG算法优. 相似文献
11.
提出一种有效的基于频繁闭项目集的关联规则挖掘算法RIFCI.该算法采用挖掘频繁项目闭集取代传统的频繁项目集,同时在项目集和事务集中展开搜索.通过对UCI机器学习库中10个数据集的测试,与工业标准C4.5比较,错误率低于19.48%,在准确度不变的情况下,生成规则数目低于传统算法,提高了算法的效率. 相似文献
12.
基于FP-tree频集模式的FP-Growth算法对关联规则挖掘的影响 总被引:9,自引:2,他引:7
通过对两个有代表性的算法Apriori和FP-Growth的剖析, 说明频集模式挖掘的过程 , 比较有候选项集产生和无候选项集产生算法的特点, 并给出FP-tree结构的构造方法以 及对挖掘关联规则的影响, 提出了对算法的改进方法. 相似文献
13.
关联规则挖掘Apriori算法的改进及其应用研究 总被引:1,自引:0,他引:1
丁卫平 《南通大学学报(自然科学版)》2008,7(1):50-53
在分析经典关联规则挖掘算法的基础上.提出了一种改进的Aprioff关联规则算法.并进行该算法的UCI机嚣学习数据库性能分析和设计电子病历关联规则挖掘应用系统.结果表明该算法在运行速度和挖掘性能上都是高效的. 相似文献
14.
关联规则挖掘的一个高效预处理算法 总被引:1,自引:1,他引:0
利用视图机制对原始数据进行预处理,把符合条件的数据和有用的属性放入视图中.根据一维(L1)和二维(L2)中的频繁数据项集对数据库中的属性进行过滤,以达到减少数据属性的目的,从而压缩数据库中的数据,为提高关联规则挖掘算法的性能打下基础. 相似文献
15.
王琳 《合肥学院学报(自然科学版)》2009,19(4):51-55
随着计算机技术和通信技术的不断发展,用户存储了越来越多、具有很高使用价值的信息,不断涌现的大量信息在给人们带来方便的同时也带来了问题,怎样提取有用信息使得数据挖掘技术应运而生.关联分析是数据挖掘的本质,关联规则挖掘是进行关联分析最常用的方法.在关联规则的Apriori算法的基础上,指出了该算法的不足之处,提出了一种新的改进算法,从而增强了算法的适应性. 相似文献
16.
数据挖掘关联规则Apriori算法的优化 总被引:3,自引:0,他引:3
关联规则挖掘研究是数据挖掘研究的一项重要的内容.Apriori算法是挖掘关联规则的经典算法,但存在一些不足之处.本文在Apriori算法基础上,提出了基于链表数据结构的关联规则改进算法.由于该算法只需对交易数据库进行一次检索,故能大量减少所需的I/O次数,提高了系统的性能. 相似文献
17.
对关联规则挖掘问题建立了完全格描述并给出了问题规模下限,提出了一种基于搜索空间划分的项集频度计算模型.在对FP-树进行改造的基础上提出基于划分思想的频繁项集挖掘算法UPM,算法的项集频度计算和非频繁项目裁剪都基于空间划分的思想.性能实验表明,与FP-Growth算法相比,UPM算法的时空效率有较大提高. 相似文献
18.
挖掘关联规则Apriori算法的一种改进 总被引:1,自引:0,他引:1
本研究在对Apriori算法分析的基础上,提出了改进的Apriori算法。改进后的算法采用矩阵表示数据库,减少了扫描事物数据库的次数;利用向量运算来实现频繁项集的计数,同时及时地去掉不必要的数据,减少了数据运算,从而提高了算法的运行效率。 相似文献
19.
关联规则的挖掘是数据挖掘中的一个重要课题.实际应用中事务数据库不断更新,而发现频繁项集代价较高,因此需要提出用于数据库中关联规则的维护算法.本文提出了基于矩阵的MFUP(matrix fast updata)算法,该算法充分利用原有挖掘结果中候选频繁项集的支持数,能有效减少对数据库的重复扫描次数.实验表明,MFUP算法是高效的. 相似文献