首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
提高频繁项集挖掘算法的效率一直是数据挖掘领域中关联规则挖掘研究的一个重点。Apriori算法是一种经典的最有影响的挖掘关联规则的算法,该算法虽然能有效地挖掘出关联规则,但是产生的冗余规则多,效率低下。针对数据挖掘的现状及关联规则算法的瓶颈问题,提出一种基于串与运算的关联规则挖掘算法,并对关联规则挖掘的未来研究方向进行了展望。  相似文献   

2.
传统试卷分析系统一般只是对考试成绩做简单的整体统计,如平均分、等级、不及格率等,用户缺乏对试题知识点掌握情况关联程度的准确了解。针对该问题提出一种基于用户反馈的关联规则挖掘算法。首先对原始数据进行预处理,得到试卷知识点评分权重表和二进制的学生得分率表。然后建立一个根据用户选择层数输出关联规则,以及查询与选定知识点相关的规则的新方案。最后,提出了一个考虑用户反馈、支持度和置信度阈值的关联规则挖掘算法,以过滤无用规则,提高挖掘效率。对VB试卷数据应用该算法,发现了基于用户反馈的有趣关联规则。实验结果表明基于用户反馈的关联规则挖掘优于其他关联规则挖掘算法,更易获得有趣的关联规则。  相似文献   

3.
分析了基于频繁模式的关联规则算法Fptree,给出了一种基于二进制表示的改进算法,详细介绍了该算法的主要思想,算法实现方案.并通过实例比较了两种算法,证明新算法提高了挖掘规则的效率.  相似文献   

4.
提出了推荐模型中的关联规则挖掘方法的改进,给出了自定义的页面权值的定义,并改进了基于关联图的关联规则挖掘算法,将页面权值应用于关联规则的挖掘中。此算法是利用Web日志中经过预处理后得到的数据进行规则挖掘,将处理后的数据应用正态分布函数来得到页面权值。用页面权值重新计算支持度,最后将得到的支持度应用于改进的规则挖掘算法中,形成一种基于权值的关联图的关联规则算法。  相似文献   

5.
基于多克隆选择的多维关联规则挖掘算法   总被引:6,自引:0,他引:6  
通过引入多克隆选择算法的思想,提出了一种基于多克隆选择的关联规则挖掘算法.仿真对比试验表明,该算法加快了关联规则挖掘的收敛速度,具有更强的全局与局部搜索能力,与基于进化算法和基于免疫算法的关联规则挖掘算法相比,明显提高了所得关联规则的准确率.  相似文献   

6.
一种基于关联规则的缺省规则挖掘算法   总被引:2,自引:1,他引:2  
传统的基于Rough集的缺省规则挖掘算法须计算差别矩阵并生成大量的条件属性类,挖掘效率低.为此,本文引入相容关联规则和决策关联规则的概念,提出基于关联规则的缺省规则挖掘算法——DRMBAR,该算法借助FP-tree存储结构挖掘出决策关联规则,并用相容关联规则性质对决策关联规则进行有效修剪后生成相应的缺省规则,DRMBAR可有效地过滤噪声、提高缺省规则挖掘效率,且克服了传统算法依赖于主存的限制,为缺省规则的挖掘提供了一种新的框架。实验结果表明该算法是有效且可行的。  相似文献   

7.
为了解决基于Apriori的分类关联规则算法挖掘数值型数据时效率和准确率偏低的问题,提出基于定量关联规则树的分类及回归预测算法。采用改进的定量关联规则算法挖掘数值型数据生成关联规则库,并基于关联规则树结构实现分类及回归预测。研究结果表明:改进的Apriori定量关联规则挖掘算法提高了分类预测的准确率并降低了计算复杂度;而采用关联规则树结构可使分类与回归预测时间明显加快,提高了样本匹配学习的速度。  相似文献   

8.
介绍了关联规则挖掘的研究情况,提出了基于聚类的周期关联规则挖掘算法,分析了该算法存在的问题并提出解决方案,展望了关联规则挖掘的未来研究方向.  相似文献   

9.
一种基于闭项集的无冗余关联规则挖掘方法   总被引:1,自引:0,他引:1  
针对关联规则挖掘中存在的规则数量过多,难于理解和应用的问题,提出了一种基于闭项集的无冗余关联规则挖掘算法.首先,给出了无冗余关联规则的定义,并基于规则信任度的概念说明了该定义的合理性;其次,在生成子、闭项集和无冗余关联规则的基础上,给出了无冗余最小-最大精确规则基和无冗余最小-最大近似规则基的定义,并讨论了它们的剪枝策略.最后,讨论了生成子的性质及连接策略,并在包含索引的基础上,给出了一种宽度优先的无冗余关联规则挖掘算法.实验结果表明,本文提出的算法不仅可以发现规模较小的无冗余关联规则,提高了挖掘结果的可理解性,而且具有较高的挖掘效率.  相似文献   

10.
数据挖掘技术在试题质量评价中的应用   总被引:1,自引:0,他引:1  
介绍了关联规则基本概念及Apriori算法,分析了关联规则挖掘在试题评价中存在的不足,提出了一种基于信息量的关联规则挖掘改进算法ARMABI.实验结果表明,该算法性能明显优于传统的关联规则挖掘算法,具有较高的推广价值.并且,对下一步工作进行了展望.  相似文献   

11.
分布数据库关联规则挖掘   总被引:4,自引:0,他引:4       下载免费PDF全文
先从理论上证明分布数据库局部频繁集与全局候选频繁集之间存在某种关系 ,利用该关系设计分布数据库关联规则挖掘算法 .该算法的局部频繁集挖掘利用FP -树实现 ,不需生成候选频繁集 ,全局频繁集在局部频繁集基础上直接生成 ,不需重新扫描各局部数据库 ,不会造成过度的网络通信开销 ,具有很好的挖掘效率  相似文献   

12.
基于FP-Growth算法,提出一种并行加权的关联规则挖掘(PWARM)算法,证明其满足加权向下封闭性.使用MapReduce计算模型,在分布式集群中并行挖掘出关联规则.实验结果表明:该算法可以满足数据权重不同的需求,且在处理大数据集时能有效地提高挖掘的效率.  相似文献   

13.
在分布式系统中如何挖掘关联规则是数据挖掘领域研究的一个重要课题.对关联规则分布式挖掘问题进行了深入探讨.基于以P2P网络模式构建的分布式事务数据库,对Apriori算法进行了推广.改进后的算法具有扩展性好、效率高、通信代价小和实现简单等优点.最后,还提出了一种由频繁项集高效产生强关联规则的算法.  相似文献   

14.
基于事务数据库的关联规则采掘算法研究   总被引:4,自引:0,他引:4  
采掘关联规则是知识发现领域的一个重要问题,文中对采掘关联规则问题进行了简单的回顾,分析了传统的关联规则Apriori算法的优缺点,设计了一种基于事务数据库的快速采掘算法TB-MA。实例证明,与Apriori算法相比,TB-MA算法削减了数据库遍历次数,提高了采掘效率,是十分有效的采掘算法。  相似文献   

15.
数据挖掘本质上是一种新的商业信息处理技术,通过对数据进行统计、分析、综合和推理,发现数据间的关联性、未来趋势以及一般性的概括知识,用以指导高级商务活动。由于需要,对数据间的关联性的数据挖掘算法模型已成为数据库及相关领域的一个研究热点,给出了一种基于分布式数据库的挖掘模型及其相应的一种有效的挖掘算法,其由若干个站点集合而成,各个站点拥有各自的数据库、中央处理机、客户端,以及各自的局部数据库管理系统,依靠通讯网络连接。采用购物篮分析式关联规则,将各个数据库文件的数据合成,从而得到挖掘结果,对挖掘的方法又进一步挖掘,即将不满足条件的规则重新传送到各分布式站点上进行更加精确的挖掘处理,从而避免了频繁的网络通讯。该算法在减轻网络频繁的通讯负担,体现并行计算以及异构数据挖掘方面具有独特优点。  相似文献   

16.
针对传统数据挖掘技术的劣势,提出一种以利润为基础的约束关联规则挖掘算法.在使用关联规则进行数据挖掘之前,算法按照商品利润的权重信息对购物篮中的原始商品交易信息实施预处理,可以使后续的数据关联规则挖掘更加的精确可靠,提升数据挖掘的效果.结果表明:基于利润的约束关联规则挖掘算法对数据库的原始数据实施了利润约束修正,增加了利润加权阈值,可有效提升数据挖掘算法的知识挖掘性能.  相似文献   

17.
随着数据库规模的日益增大,关联规则挖掘需要在挖掘效率、可用性、隐私性及精确性等方面得到提升,需要对传统的关联规则挖掘算法进行更新和改进。在传统的Apriori算法基础上,提出了一种新的在关系数据库中挖掘关联规则的算法。该算法只需扫描一次数据库即可得到频繁项集,并通过非频繁项集来减少候选项集的生成,从而提高了算法的运算效率;此外,该算法将包含敏感数据事务做相关的处理,以达到隐藏包含敏感数据的关联规则。理论分析和实验结果表明,新算法不仅提高了关联规则挖掘的效率,而且还达到了隐藏包含敏感规则的目的。  相似文献   

18.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有意义的关联。随着大量数据不停的收集和存储,从数据库中挖掘关联规则显得越来越有必要性,关联规则挖掘的Apriori算法是数据库挖掘的最经典算法并得到广泛应用,在介绍关联规则挖掘和Apriori算法的基础上,发现Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。综述了Apriori算法的主要优化方法,并指出了Apriori算法在实际中的应用领域,提出了未来Apriori算法的研究方向和应用发展趋势。  相似文献   

19.
基于模式矩阵的FP-growth改进算法   总被引:10,自引:0,他引:10  
数据挖掘中关联挖掘算法比较典型的有Apriori和FP—growth算法.实验和研究证明FP—growth算法优于Apriori算法.但是针对大型数据库这两种算法都存在着较大缺陷,不仅要两次或多次扫描数据库,而且很难处理支持度和数据变化等关联规则更新问题.作者提出了基于模式矩阵的FP—growth改进算法,它至多扫描数据库一次,特别在更新问题上不用重新扫描数据库.通过实验结果分析,验证了这种改进算法相对于原有FP—growth算法的优势,特别在大数据集下,大大降低了挖掘的时间复杂度.  相似文献   

20.
关联规则的挖掘是数据挖掘中的一个重要课题.实际应用中事务数据库不断更新,而发现频繁项集代价较高,因此需要提出用于数据库中关联规则的维护算法.本文提出了基于矩阵的MFUP(matrix fast updata)算法,该算法充分利用原有挖掘结果中候选频繁项集的支持数,能有效减少对数据库的重复扫描次数.实验表明,MFUP算法是高效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号