共查询到20条相似文献,搜索用时 78 毫秒
1.
基于候选最大频繁项目集的关联规则挖掘算法 总被引:3,自引:0,他引:3
提高频繁项目集算法的效率是关联规则挖掘研究的一个重点领域 ,就此提出了基于候选最大频繁项目集的关联规则挖掘算法 ,通过实例说明了算法的执行过程 ,并与FP -Tree等其他算法作了比较 相似文献
2.
为减少关联规则挖掘中数据库扫描次数,提出了一种基于准频繁项目集的关联规则挖掘算法———SupposedFrequent,同时给出了候选频繁项目集的产生函数———BGen.最后通过实验证明:在给定最好的准频繁项目集的条件下,只需扫描数据库两次就能产生全部的频繁项目集。 相似文献
3.
基于数组的频繁项目集的挖掘算法 总被引:4,自引:0,他引:4
挖掘关联规则是数据挖掘研究的一个重要方面.然而,目前提出的算法仍存在一些问题,如复杂的数据结构、大量的候选频繁项目集生成等等.本文提出使用了一种简单的数据结构——数组,并提出了基于数组的一种新的频繁项目集的挖掘算法. 相似文献
4.
挖掘频繁闭项目集是数据挖掘领域中的一个重要研究方向,人们已提出了许多用于高效地发现大规模数据库中频繁闭项目集的算法,但对其更新维护问题的研究却比较少.在分析了频繁闭项目集更新算法关键技术的基础上,提出一种快速的增量式频繁闭项目集更新算法FUFCIA(fastupdating frquent closed itemsets algorithm),该算法将充分利用先前挖掘过程中所产生的信息来节省发现新的频繁闭项目集的时间开销,降低了候选频繁闭项目集的规模,减少了扫描数据库的次数.最后对该算法进行分析和讨论,并进行试验验证,试验结果表明算法FUFCIA是有效的. 相似文献
5.
6.
关联规则最大频繁项目集的快速发现算法 总被引:7,自引:1,他引:7
提出一种快速发现最大频繁项目集的算法, 该算法对集
合枚举树进行改进, 结合自底向上与自顶向下的搜索策略, 利用非频繁项目集对候选最大频
繁项目集进行剪枝和降维, 减少了不必要候选最大频繁项目集的数量, 显著提高了发现的效
率. 相似文献
7.
利用关联规则建立故障与故障表象之间的关系,对故障进行分析和预测是一种重要的故障检测手段.然而普通关联规则具有表达冗余量大和计算复杂的缺点,为此,提出采用频繁闭模式的方法来挖掘故障特征间的关联关系,并以此建立故障分析过程.由于频繁闭模式挖掘剔除冗余复杂,计算量大,在挖掘简洁故障状态关联规则过程中,采用搜索空间提前剪枝的方法直接生成频繁闭模式,避免了保存频繁模式并反复扫描原始数据和过滤候选频繁闭模式的过程.同时整个挖掘结构在挖掘过程中由于不断被删除回收,占用内存会越来越少,最终在枚举出的基于闭模式简洁规则的基础上,建立故障事件转换图,进行故障诊断.实验部分验证了方法的有效性. 相似文献
8.
钱进 《江苏技术师范学院学报》2004,10(4):61-64
提高最大频繁项目集挖掘算法的效率是关联规则挖掘研究一个重点领域。本文主要对影响最大频繁项目集挖掘效率的数据分布、搜索策略、支持度计算及剪枝策略等技术进行研究。 相似文献
9.
关联规则增量式更新算法 总被引:1,自引:0,他引:1
宋海声 《兰州大学学报(自然科学版)》2004,40(2):47-50
讨论了关联规则的更新问题,对关联规则的增量式更新算法IUA进行了分析,指出了其存在的问题和出现问题的原因,提出了一种改进的关联规则更新算法UA.对各种情况下关联规则的更新问题进行了讨论,说明了其均可以转化为数据库不变、支持度改变的情况来讨论,UA算法在充分利用原有信息的基础上,提高了算法的效率。 相似文献
10.
基于集合运算的频繁集挖掘优化算法 总被引:1,自引:0,他引:1
挖掘关联规则是数据挖掘中一个重要的课题,产生频繁项目集是其中的一个关键步骤。 提出了一种基于集合运算的频繁项目集挖掘算法,并将该算法与经典算法Apriori进行比较。该算法只需要对数据库扫描一遍。实验表明该算法的效率较好。 相似文献
11.
一种关系数据库中基于云模型关联规则的提取 总被引:2,自引:1,他引:2
为了发现有效的关联规则,属性在比较高的水平被范化,允许相邻属性值或者语言项的重量.这种软划分可以映射人类的想法,同时使发现的知识鲁棒.利用云模型的理论与方法求解数量关联问题,给出了一种云关联规则的定义,并提出了基于云模型理论支持度和置信度的计算方法,最后提出了一种提取算法Cloud model A.这种方法较好地软化了数量属性论域的划分边界,从而使得挖掘出的云关联规则更容易被人理解。 相似文献
12.
利用视图机制对原始数据进行预处理,把符合条件的数据和有用的属性放入视图中.根据一维(L1)和二维(L2)中的频繁数据项集对数据库中的属性进行过滤,以达到减少数据属性的目的,从而压缩数据库中的数据,为提高关联规则挖掘算法的性能打下基础. 相似文献
13.
一种高效相联规则提取算法 总被引:3,自引:0,他引:3
在 Apriori 算法基础上, 提出改进算法 Apriori Pro. 利用中间结果对数据库进行过滤,从而加快候选项集的计数速度, 提高了整个算法的效率. 相似文献
14.
挖掘关联规则Apriori算法的一种改进 总被引:1,自引:0,他引:1
本研究在对Apriori算法分析的基础上,提出了改进的Apriori算法。改进后的算法采用矩阵表示数据库,减少了扫描事物数据库的次数;利用向量运算来实现频繁项集的计数,同时及时地去掉不必要的数据,减少了数据运算,从而提高了算法的运行效率。 相似文献
15.
对关联规则挖掘问题建立了完全格描述并给出了问题规模下限,提出了一种基于搜索空间划分的项集频度计算模型.在对FP-树进行改造的基础上提出基于划分思想的频繁项集挖掘算法UPM,算法的项集频度计算和非频繁项目裁剪都基于空间划分的思想.性能实验表明,与FP-Growth算法相比,UPM算法的时空效率有较大提高. 相似文献
16.
赵旭俊 《太原科技大学学报》2012,(1):18-22
传统的基于支持度—置信度框架的关联规则挖掘方法可能会产生大量不相关的、甚至是误导的关联规则,同时也不能区分正负关联规则。在充分考虑用户感兴趣模式的基础上,采用一阶谓词逻辑作为用户感兴趣的背景知识表示技术,提出了一种基于背景知识的包含正负项目集的频繁模式树,给出了针对正负项目集的约束频繁模式树的构造算法NCFP-Construct,从而提高了关联规则挖掘的效率和针对性,实验结果显示该方法是有效的。 相似文献
17.
数据挖掘关联规则Apriori算法的优化 总被引:3,自引:0,他引:3
关联规则挖掘研究是数据挖掘研究的一项重要的内容.Apriori算法是挖掘关联规则的经典算法,但存在一些不足之处.本文在Apriori算法基础上,提出了基于链表数据结构的关联规则改进算法.由于该算法只需对交易数据库进行一次检索,故能大量减少所需的I/O次数,提高了系统的性能. 相似文献
18.
基于频繁集的多层次交互式关联规则挖掘 总被引:2,自引:0,他引:2
定义了一系列关联规则的相关概念 ,然后 ,针对现有的销售事务数据库 ,提出了一种改进的获取多层次信息方法 ,并据此对各数据进行压缩编码 ,减少处理时间 .同时 ,借助频繁集和交互式技术 ,实现多个概念层次交互式挖掘 ,以按用户实际需要提取出其感兴趣的关联规则 ,从而提高了挖掘速度和运行效率 相似文献
19.
基于支持格的关联规则挖掘算法 总被引:1,自引:0,他引:1
提出了一种基于支持格的关联规则挖掘算法(ARSL),该算法连续扫描数据库事务序列,逐步构造支持格,对数据库扫描不超过2遍即可求得所有大项目集。首次扫描数据库时,能提供反馈信息,允许用户对最小支持率进行调整。该算法能连续处理事务序列,可用于网上在线数据挖掘。 相似文献
20.
在所有频繁项集挖掘算法中,Apriori算法一直是一个经典的算法,但是该算法存在的最大缺陷是要进行多次的数据库扫描并且在挖掘过程中产生大量的候选频繁项集,因此效率很低.提出了利用基于矩阵的方法挖掘频繁项集,很好地避免了这个缺陷. 相似文献