首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
关联规则挖掘算法FP-Growth在挖掘大型数据库时,占用内存大、运行速度慢或根本无法构造基于内存的FP-tree。针对这些问题,文章提出一种适合于挖掘较大型数据库的新的关联规则挖掘算法DFP-Growth,新算法将数据库分解,然后对分解得到的各个数据库子集用FP-Growth算法进行约束频繁项集挖掘,以满足大型数据库挖掘的需求。  相似文献   

2.
关联规则挖掘是数据挖掘的一个重要组成部分.为提高关联规则的挖掘效率,提出了一种基于布尔矩阵和MapReduce的FP-Growth算法(BPFP),分析了算法的时间和空间复杂度.该算法使用Hadoop框架和布尔矩阵以减少对事务数据的扫描次数,利用两次MapReduce来实现频繁项集的挖掘.在多个数据集上的实验结果表明,与原FP-Growth算法相比,BPFP算法具有更高的执行效率、更好的加速比.  相似文献   

3.
基于FP-tree频集模式的FP-Growth算法对关联规则挖掘的影响   总被引:9,自引:2,他引:7  
通过对两个有代表性的算法Apriori和FP-Growth的剖析, 说明频集模式挖掘的过程 , 比较有候选项集产生和无候选项集产生算法的特点, 并给出FP-tree结构的构造方法以 及对挖掘关联规则的影响, 提出了对算法的改进方法.  相似文献   

4.
关联规则的挖掘是数据挖掘领域的重要研究内容之一.关联规则的挖掘算法大都在用户设置的支持度阈值的限制条件下,挖掘出数据属性之间的关系.但是没有相关领域的专门知识,用户很难设置合适的支持度阈值得到合适的结果.本文在Apriori算法的基础上,提出一种无支持度的关联规则挖掘方法.  相似文献   

5.
约束关联规则挖掘是根据用户提出的各种约束条件从交易数据库中挖掘出用户感兴趣的关联规则。该文针对目前提出的诸多约束关联挖掘算法只适应于静态数据库的情况,且挖掘出的约束关联规则存在效率低等缺点,提出一种基于倒排索引树的增量更新约束关联规则挖掘算法UPC-IITree,该算法将树型结构与倒排索引相结合,以实现无需扫描原始数据库和不产生候选项集的情况下,解决原始DB新增数据集时能高效地维护满足用户给定约束条件的关联规则。通过实验与其他相关算法进行对比,实验结果表明,UPC-IITree算法减少了算法的执行时间,节约了内存空间,提高了挖掘效率。  相似文献   

6.
摘要 为了增加电子商务网站的销售额,分析了商品推荐在电子商务系统中的作用,研究了数据挖掘中的正负关联规则挖掘技术的特点,提出了一种新的正负关联规则挖掘算法。新算法通过使用旋转数据库和位运算减少了扫描原始数据库的次数,加快了挖掘速度。另外,新算法在挖掘正规则的同时,利用负规则裁减掉无效规则,得到的结果更符合用户的购物行为。通过测试得出新算法比传统的Apriori算法执行时间更短,商品推荐更精确。  相似文献   

7.
挖掘关注的语言值关联规则   总被引:1,自引:0,他引:1       下载免费PDF全文
为了解决利用RFCM算法划分数量型属性,并通过组合语言值进行语言关联规则挖掘中出现的规则数量太多,以及难于获得用户真正关注的规则等问题,提出了一种改进的语言值关联规则挖掘算法。通过最大隶属原则将记录在数量型属性上的取值转换为语言值,然后转换成布尔型属性关联规则挖掘问题。同时,给出一个能够度量语言值关联则简洁性和新奇性关注程度(兴趣度)的计算函数,用于减少选取关注语言值关联规则的工作量。采用本文提出的方法对一组实例数据进行实验,得到了关注程度较高的语言值关联规则。所采用的方法能适用于含有大量数量型属性的数据库,并能有效地获取用户关注的规则。  相似文献   

8.
针对模糊属性事务数据库提取模糊关联规则的问题,采用模糊概念格与模糊关联规则相结合的方法,实现格节点与属性项集的对应关系,提出模糊关联规则格理论,在渐进式建格算法基础上对格节点相应修改,给出了适用于动态数据库的模糊关联规则格的构建思想.利用模糊关联规则格挖掘关联规则,与采用Apriori算法计算频繁项目集获取规则相比较,容易获得用户感兴趣的关联规则,同时减少冗余规则的生成,使挖掘算法得到优化.  相似文献   

9.
在交易数据库的挖掘研究中,模式未来行为的预测已成为用户关注的焦点。通常是通过分析和挖掘历史交易数据库中的数据得到模式未来行为——频繁出现程度,以便帮助用户决策。为解决这类问题,设计一个基于回归法的算法挖掘一类新模型超期望模式。实验结果表明这种模式在模式评价和模式预测方面很有效,它同时为减少冗余规则提供了一种可行的方法。  相似文献   

10.
针对现有的安全审计规则及审计模型存在的准确率不高、检测效率低、规则适应性差等问题,本文设计了一种基于关联规则挖掘的网络安全审计模型,并在该模型中引入FP-Growth算法自动生成审计规则。该模型提高了安全审计的准确率以及规则的自适应能力,不仅能审计己知的异常行为,也能审计出未知的异常行为。  相似文献   

11.
邹丽霞 《河南科学》2010,28(9):1125-1129
对传统的关联规则挖掘算法FP-Growth方法进行改进,提出FP-Mine算法,并应用该算法对Web日志进行挖掘,探寻用户访问站点页面之间的关联规则,来帮助管理员改善站点的设计和企业改进市场商务决策.实验结果证明FP-Mine算法在生成频繁项集及关联规则的过程中,只需存储i-size和(i+1)-size频繁项集的节点的Freq-Set-Tree,且立即在其之上生成规则,所以缩短规则生成的时间,提高规则生成效率,同时释放i-size项集的节点,有效地节省内存空间.  相似文献   

12.
将FP-Growth算法应用于面向目标的关联规则(OOA)挖掘,对FP-Tree的结点进行了修改,增加了目标支持度计数和效用度累计两个字段,对FP-Growth算法进行了改进.实验结果表明,改进后的方法比基于Apriori算法和基于Dfree算法的OOA挖掘效率更高。  相似文献   

13.
在几种流行的推荐算法的基础上,本文提出了一种新的融合用户聚类和关联规则的算法来改善推荐效果。该算法在经典的关联规则算法Apriori基础上引入多最小支持度的概念,并在关联规则算法之前进行用户聚类,在聚类算法中使用了包含字符属性的混合属性距离函数,提高聚类效果。在此算法的基础上,设计并实现了一种新的基于图书馆的推荐系统。实验证明该算法改善了数字图书馆中新书的推荐质量,去除了部分只含高浏览量图书的无意义规则,并趋向于发现相近种类图书的关联性。  相似文献   

14.
文章提出了一种新的决策树构建算法,算法选择使生成的规则满足给定可信度阀值且支持度最大的属性作为结点,不仅简化了生成的决策树;且可以根据用户输入的可信度,得到相应的决策规则集,提高了决策树的泛化能力,有效地去除了噪音规则。应用实例分析,结果表明算法提取的决策规则简洁有效。  相似文献   

15.
为解决在线学习平台中知识表现离散、系统性不高和知识模型适用性差等问题,提出基于知识图谱的知识模型构建,再利用 FP-Growth 数据挖掘算法进行关联规则挖掘,实现知识模型的动态更新。通过实践证明,知识图谱可有效改善知识模型的系统性,FP-Growth 算法充分考虑了学生因素对知识模型的影响,提高了模型的适用性。  相似文献   

16.
关联规则挖掘在许多数据挖掘中有着广泛的应用。当数据库和支持度阈值发生变化时,现有的挖掘方法普遍存在多次扫描数据库或重复遍历复杂数据结构的问题。该文基于增量式更新算法(IUA)和快速更新算法(FUP),提出在数据库与支持度阈值同时变化情况下的关联规则动态维护算法ARDM,并通过Hash结构与模式增长方法进行优化。实验表明:该算法充分利用了已挖掘结果,在数据库和支持度阈值同时变化时比FP-Growth大幅提高了执行效率。最后,将该算法应用于企业财务指标及财务比率分析。  相似文献   

17.
对频繁模式增长(FP-Growth)算法进行了改进,用哈希头表代替头表.通过合并频繁模式树(FP-Tree)中支持数相同的结点,压缩了树的规模,有效地节省了空间.实验结果表明,改进后的算法在查找效率上有了大幅度的提高,可以更好地适用于大规模数据集的关联规则挖掘.  相似文献   

18.
指出了入侵检测系统中的常见约束条件,即关键属性约束、挖掘范围约束、个数约束.在分析这些约束条件性质的基础上提出了3种剪枝策略,对基于"支持度-可信度"度量机制的FP_tree算法进行了扩展.实验结果表明:新的算法提高了挖掘效率,删除了许多无意义的模式.  相似文献   

19.
针对光纤接入(fiber to the x,FTTx)网络规划中频繁路径挖掘问题,在经典算法FP-Growth,SPADE的基础上,结合格理论,利用频繁项集扩展枚举树作为搜索空间,并引入位图方便扩展运算和支持度计算,提出了一个改进的频繁序列挖掘算法FSM+。详细介绍了该算法的相关性质和基本理论,阐述了该算法的基本思想和实现伪码。在VC++6.0和单机的环境下,利用不同规模用户装机数据集和最小支持度比较了该算法与SPADE,FP-Growth算法的性能和准确性。实验证明,FSM+算法在小规模数据集下性能优势并不明显,但在大数据集下其计算性能分别是SPADE,FP-Growth的5倍和7倍多,挖掘结果与SPADE,FP-Growth算法相同。从而在实际网络规划过程中,快速计算信任度较高的频繁模式,并与人工经验干预相结合,来进一步保证预测路径准确有效。  相似文献   

20.
基于FP-Growth算法,提出一种并行加权的关联规则挖掘(PWARM)算法,证明其满足加权向下封闭性.使用MapReduce计算模型,在分布式集群中并行挖掘出关联规则.实验结果表明:该算法可以满足数据权重不同的需求,且在处理大数据集时能有效地提高挖掘的效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号