首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
具有动态加权特性的关联规则算法   总被引:8,自引:1,他引:7  
基于FP_growth关联规则, 提出一种具有动态加权特性 的改进算法. 把事务数据库中的项目按其重要程度划分为5个等级; 运用层次分析(AHP)算法 构造判断矩阵, 计算特征向量; 将得到的向量作为权值, 与项目在事务数据库中出现的次数 综合考虑作为衡量重要程度的标准, 生成FP_tree; 最后得到频繁项目集和关联规则. 由于 权重的赋予过程可以由领域专家动态地改变, 这样不但能挖掘出更有意义的规则, 而且在算 法的运行初期就大量剔除了那些权重小的无用项目集, 从而大大提高了算法的运行效率.  相似文献   

2.
为提高网络告警数据的处理效率,迅速找出故障根源,以保证整个电信网络的正常运行。针对告警数据的特点对传统的关联规则算法进行了相应的改进,提供了优先剪枝策略,避免了生成没有意义的频繁项集;k-1-项集通过连接操作生成k项集,避免了反复扫描数据库所带来的压力。结果表明,改进算法提高了挖掘效率,达到快速诊断网络故障的目的。  相似文献   

3.
基于FP-Growth算法,提出一种并行加权的关联规则挖掘(PWARM)算法,证明其满足加权向下封闭性.使用MapReduce计算模型,在分布式集群中并行挖掘出关联规则.实验结果表明:该算法可以满足数据权重不同的需求,且在处理大数据集时能有效地提高挖掘的效率.  相似文献   

4.
考虑事务数据库D长度不变、项目集I发生变化并且带有权重时的关联规则挖掘问题,提出了一种针对项目集增加的加权关联规则更新算法,解决了增加项目集的加权关联规则更新问题,与对新数据库重新运行算法相比,其运行效率有显著提高.  相似文献   

5.
介绍了模糊关联规则挖掘算法的基本思想及实现步骤,提出了模糊关联规则的并行挖掘算法.并行挖掘算法采用并行的模糊c-均值算法将数量型属性划分成若干个模糊集,并借助模糊集软化属性的划分边界.用改进布尔型关联规则的并行挖掘算法来发现频繁模糊属性集.最后由多个处理器并行地产生满足最小模糊信任度的模糊关联规则.在分布式互连的PC/工作站环境下进行性能分析,结果表明并行的挖掘算法具有好的可扩展性、规模增长性和加速比性能.  相似文献   

6.
由于能反映用户的偏好,可以弥补传统频繁项集挖掘仅由支持度来衡量项集重要性的不足,高效用项集正在成为当前数据挖掘研究的热点.为使高效用项集挖掘更好地适应数据流环境,提出了一种基于事务型滑动窗口的数据流中高效用项集挖掘算法MHUIDS.首先在二进制向量的基础上,提出了高事务加权效用项集树(HTWUI-树)的结构.进而分别给出了事务型滑动窗口初始化与滑动的算法描述.最后,提出了高效用项集的剪枝策略与挖掘算法.实验结果表明,MHUIDS算法具有较高的挖掘效率及较低的存储开销.  相似文献   

7.
随着数据库规模的日益增大,关联规则挖掘需要在挖掘效率、可用性、隐私性及精确性等方面得到提升,需要对传统的关联规则挖掘算法进行更新和改进.在传统的Apriori算法基础上,提出了一种新的在关系数据库中挖掘关联规则的算法.该算法只需扫描一次数据库即可得到频繁项集,并通过非频繁项集来减少候选项集的生成,从而提高了算法的运算效率;此外,该算法将包含敏感数据事务做相关的处理,以达到隐藏包含敏感数据的关联规则.理论分析和实验结果表明,新算法不仅提高了关联规则挖掘的效率,而且还达到了隐藏包含敏感规则的目的.  相似文献   

8.
随着数据库规模的日益增大,关联规则挖掘需要在挖掘效率、可用性、隐私性及精确性等方面得到提升,需要对传统的关联规则挖掘算法进行更新和改进。在传统的Apriori算法基础上,提出了一种新的在关系数据库中挖掘关联规则的算法。该算法只需扫描一次数据库即可得到频繁项集,并通过非频繁项集来减少候选项集的生成,从而提高了算法的运算效率;此外,该算法将包含敏感数据事务做相关的处理,以达到隐藏包含敏感数据的关联规则。理论分析和实验结果表明,新算法不仅提高了关联规则挖掘的效率,而且还达到了隐藏包含敏感规则的目的。  相似文献   

9.
朱燕燕 《科技信息》2011,(15):143-143,387
针对关联规则挖掘中Apriori算法的不足,提出了一种改进算法。该算法使用完美哈希函数,优化的事务压缩技术,分组查询计数和直接产生候选项集的技术来挖掘频繁项集,从而提高了算法效率。最后,通过对两种算法进行性能比较,验证了改进算法的优越性。  相似文献   

10.
Apriori算法是关联规则的一个重要算法。对关联规则挖掘算法Apriori算法的关键思想以及性能进行了研究,通过对候选项集的属性进行加权运算,减少了产生的频繁集,提高了算法的效率,使算法产生的规则更有应用价值。  相似文献   

11.
针对传统的关联分析算法Apriori执行效率低、I/O过重、计算量过大等问题,提出了一种通过减少扫描数据库次数来降低候选项集计算复杂度, 在频繁项集求解过程中通过将事务项集转换为行向量,利用“与”操作来提高算法执行效率的Apriori改进算法。利用学生在校行为数据集对Apriori改进算法进行有效性和高效性验证。同时,为了符合算法对样本数据的要求,在样本数据处理过程中对原始数据进行了清洗和离散化处理,定义了分析对象的样本数据离散化处理的规则。通过实验分析比较了Apriori改进算法与经典Apriori算法的性能。结果表明,Apriori改进算法保持了对实际分析对象关联规则挖掘的有效性,同时具有更高的执行效率。  相似文献   

12.
针对模糊属性事务数据库提取模糊关联规则的问题,采用模糊概念格与模糊关联规则相结合的方法,实现格节点与属性项集的对应关系,提出模糊关联规则格理论,在渐进式建格算法基础上对格节点相应修改,给出了适用于动态数据库的模糊关联规则格的构建思想.利用模糊关联规则格挖掘关联规则,与采用Apriori算法计算频繁项目集获取规则相比较,容易获得用户感兴趣的关联规则,同时减少冗余规则的生成,使挖掘算法得到优化.  相似文献   

13.
提出了基于DBSCAN(density-based spatial clustering of application with noise)和多约束活动窗口算法的告警时间序列预处理方法。根据原始告警数据的特点,利用DBSCAN聚类算法以时间维度将原流水告警数据划分为多个告警事件,并通过约束条件选取DBSCAN最佳输入参数,在各个时间段利用滑动时间窗口提取告警事务。实验结果表明,该方法能有效滤除单一告警事务(噪声告警)对实际事务分析的影响,提升告警事务分析的总体质量,同时可根据实际需要利用多约束条件选择最佳参数,有效提升告警事务总体分析能力。  相似文献   

14.
基于PSO的加权关联规则挖掘算法   总被引:1,自引:0,他引:1  
简要描述了加权关联规则问题及离散粒子群优化算法,提出了一种基于粒子群优化(PSO)算法的加权关联规则挖掘算法(PSO-WMAR).实验证明,本算法运行时间更省,产生的规则数更少且更有效.该算法具有以下特点:1)把关联规则挖掘的两个阶段结合在一起,无须先挖掘出全部频繁项目集然后再提取规则;2)只需要扫描一次数据库;3)把兴趣度引入适合度函数之中,挖掘出的规则数量更少、更有效;4)求加权频繁项目集无须查找所有候选加权频繁项目集,或者求频繁项目集的高序子集或非频繁项目集的低序超集.  相似文献   

15.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有意义的关联。随着大量数据不停的收集和存储,从数据库中挖掘关联规则显得越来越有必要性,关联规则挖掘的Apriori算法是数据库挖掘的最经典算法并得到广泛应用,在介绍关联规则挖掘和Apriori算法的基础上,发现Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。综述了Apriori算法的主要优化方法,并指出了Apriori算法在实际中的应用领域,提出了未来Apriori算法的研究方向和应用发展趋势。  相似文献   

16.
关联规则挖掘的AprioriTid算法的改进   总被引:1,自引:0,他引:1  
关联规则挖掘是数据挖掘中常见的一种形式。高效地找出频繁项目集是关联规则挖掘的中心问题.文章在分析生成频繁项目集的AprioriTid算法的基础上,指出了算法中存在由于项目的重复存储而使数据量偏大的问题,提出并证明了“Ck—l中支持率小于minsupport的项目集在Ck-1中是无用的”的定理。并以此为依据改进了算法.实验表明,改进算法在缩小数据规模方面是行之有效的.  相似文献   

17.
针对Apriori算法在面对大规模数据时效率较低的问题,提出了一种基于划分和压缩数据库的改进方法。该方法首先依据特征数据出现的频率将数据按照升序存储在临时数组中;然后将原始事务数据库分为几个互不相交的事务数据库,使得子数据库能够容纳在内存中;最后根据每个子数据库计算出的频繁项集计算整个数据库的频繁项集,从而消除了不必要的冗余数据。通过改进可以将大规模数据集进行有效的划分和压缩,对子数据库进行关联规则挖掘。实验结果表明,改进的Apriori算法在针对海量数据挖掘的执行速度和效率都有很大提高。  相似文献   

18.
关联规则挖掘是从事务数据库中发现大量数据中项集之间存在的有意义的隐藏关系。本文探讨了关联规则挖掘如何应用于医保稽查工作,并论述了对Apriori算法进行的具有针对性的改进。  相似文献   

19.
针对传统数据挖掘技术的劣势,提出一种以利润为基础的约束关联规则挖掘算法.在使用关联规则进行数据挖掘之前,算法按照商品利润的权重信息对购物篮中的原始商品交易信息实施预处理,可以使后续的数据关联规则挖掘更加的精确可靠,提升数据挖掘的效果.结果表明:基于利润的约束关联规则挖掘算法对数据库的原始数据实施了利润约束修正,增加了利润加权阈值,可有效提升数据挖掘算法的知识挖掘性能.  相似文献   

20.
基于数据库约简的关联规则挖掘算法   总被引:7,自引:0,他引:7  
通过对Apriori算法挖掘过程进行分析,提出了一种基于数据库约简的关联规则挖掘算法.该算法利用每趟挖掘中一些非频繁项集的超集、并集,逐步约简事务数据库中的事务,提高了关联规则的挖掘效率.在这些非频繁项集的基础上建立了数据库约简的定理和推论,并在Apriori算法的基础上设计了ApioriNEW算法.经过对算法进行分析和实验,算法ApioriNEW的挖掘效率比较高.一般情况下,平均可将挖掘效率提高约30%.ApioriNEW算法特别适合大型数据库的关联规则挖掘,已应用在网络故障诊断专家系统的知识获取中.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号