共查询到19条相似文献,搜索用时 78 毫秒
1.
本文利用Apriori算法对图书管理集成系统产生的流通数据进行数据挖掘,找出读者借阅书目之间的关联规则,从而指导图书馆工作人员主动的向读者推荐满意的图书。 相似文献
2.
关联规则挖掘是数据挖掘的一个重要组成部分.为提高关联规则的挖掘效率,提出了一种基于布尔矩阵和 MapReduce 的 FP- Growth 算法( BPFP) ,分析了算法的时间和空间复杂度.该算法使用 Hadoop 框架和布尔矩阵以减少对事务数据的扫描次数,利用两次MapReduce 来实现频繁项集的挖掘.在多个数据集上的实验结果表明,与原 FP- Growth 算法相比,BPFP 算法具有更高的执行效率、更好的加速比. 相似文献
3.
关联规则是数据挖掘的一个重要研究内容,主要用于从大量数据集中挖掘出有价值的数据项之间的关联关系.典型案例是超市的购物篮分析,主要对顾客的购买记录数据库进行关联规则挖掘,可以发现顾客的购买行为.本文依据Apriori算法的两个基本性质,即任何大项集的子集一定是大项集,非大项集的超集一定是非大项集,对经典的Apriori算法要多次扫面事务数据库的问题,作了一些改进,并进行仿真计算,结果表明,改进的算法确实减少了扫描次数. 相似文献
4.
焦亚冰 《太原师范学院学报(自然科学版)》2008,7(2):103-106
数据挖掘应用极大地推动了人们掌握、处理信息的能力.文章主要介绍了数据挖掘中的关联规则,关联规则中的经典算法Apriori算法,以及Apriori算法存在的不足,提出了Apriori算法的改进研究. 相似文献
5.
针对Apriori算法在面对大规模数据时效率较低的问题,提出了一种基于划分和压缩数据库的改进方法。该方法首先依据特征数据出现的频率将数据按照升序存储在临时数组中;然后将原始事务数据库分为几个互不相交的事务数据库,使得子数据库能够容纳在内存中;最后根据每个子数据库计算出的频繁项集计算整个数据库的频繁项集,从而消除了不必要的冗余数据。通过改进可以将大规模数据集进行有效的划分和压缩,对子数据库进行关联规则挖掘。实验结果表明,改进的Apriori算法在针对海量数据挖掘的执行速度和效率都有很大提高。 相似文献
6.
洪少春 《辽宁师专学报(自然科学版)》2005,7(4):31-33,83
关联规则挖掘是目前数据挖掘的研究难点之一,介绍了关联规则的划分情况,对频集算法进行了改进,提出了处理数值型字段的基本方法,展望了关联规则挖掘的未来研究方向. 相似文献
7.
因初始项集中的数据特征相关,使关联规则Apriori算法的数据挖掘结果存在误差.为了解决这个问题,结合粗糙集理论(RST),提出一种改进的关联规则数据挖掘算法;然后,将该算法应用到软件工程风险因素和风险缓解因素管理分析中,提出一种新的软件工程适应性结构.仿真结果表明,该改进算法提高了挖掘数据的效率. 相似文献
8.
一种改进的Apriori算法 总被引:3,自引:0,他引:3
介绍了关联规则挖掘的情况,并在分析关联规则的数据挖掘算法的基础上,提出一个改进的Apriori算法.新算法仅对数据库扫描一次,就能找出所有的频繁项集,从而提高了挖掘的效率,具有一定的实用性 相似文献
9.
一种改进的Apriori算法 总被引:1,自引:0,他引:1
Apriori算法存在许多可以改进的地方.例如它需要反复读取数据库,并且读取的次数由项目集中的项目个数来确定,I/O负载与最大项目集的项数成正比.本文提出一种只读一次数据库的的改进算法. 相似文献
10.
为了提高词性标注模型训练语料的质量,设计了一种利用FP-Growth算法从训练语料库中自动获取词性标注规则的方法,并将该方法与基于Apriori算法的词性标注规则获取方法进行了对比实验.实验结果显示,对于0.1万、0.2万和1万词级的小规模语料库,2种方法获取的词性标注规则条数均相同,但基于FP-Growth算法的时间耗费分别仅为基于Apriori算法的0.013 866%,0.010 399%,0.003 132%;对于10万、100万词级的训练语料库,基于Apriori算法无法获取任何规则,但基于FP-Growth算法依然可以在合理时间内获取有效的规则.这说明,基于FP-Growth算法的词性标注规则获取方法是可行且高效的,满足在优化训练语料库时能从不同规模的语料库中自动获取词性标注规则的实际需求. 相似文献
11.
给出三类约束,并讨论了约束的反单调性,实现了一种交互式的可约束的最小关联规则集挖掘算法,并分析了算法的优越性。 相似文献
12.
13.
数据挖掘就是利用机器学习的方法从大量数据中提取有价值知识的过程.本文以运动员体能测试数据为分析对象,研究应用数据挖掘技术解决运动员体能指标优化分析问题的方法.文中重点介绍了关联规则挖掘的原理与方法,提出并实现了适宜于网球运动员体能指标优化分析的算法,并进行了实际应用,发现了出乎常规的规律. 相似文献
14.
通过对Apriori算法的分析,提出了一种关联规则挖掘的改进算法Apriori_Q。该改进算法减少了模式匹配和对数据库访问的次数,理论分析与实验结果表明,Apriori_Q提高了关联规则生成的效率,因而更具有实用价值。 相似文献
15.
基于矩阵的频繁项集发现算法 总被引:3,自引:0,他引:3
Apriori算法是关联规则的经典算法.在分析经典Apriori算法的基础上,提出了一种有效的基于矩阵的Apriori的改进算法.该算法应用了矩阵的思想,只需对数据库扫描一次,即可得到频繁项集,大大提高了算法的效率. 相似文献
16.
一种基于改进型遗传算法的关联规则提取算法及其应用 总被引:3,自引:0,他引:3
对关联规则的数据挖掘和遗传算法进行了概述,阐述了关联规则数据挖掘的现实意义,提出了一种采用改进型遗传算法的关联规则提取方法,并给出了具体的算法,最后结合一个具体实例进行了应用。 相似文献
17.
传统的联结规则挖掘算法依赖于一个不现实的假设:用户可以指定最小支持度.如果用户不了解他们的数据库,指定的最小支持度是肯定不适合的.在此设计了一个基于遗传算法的挖掘策略。它具有两个显然的优点:①高性能且自动化的规则挖掘;②不要求用户指定最小支持度。 相似文献
18.
在高校的科研管理工作中应用关联规则挖掘技术,通过挖掘教师的科研成果数据,可以得到教师科研工作中的潜在信息,辅助决策下一阶段的科研管理工作。 相似文献
19.
关联规则挖掘是从大量的数据中挖掘出有价值描述数据项之间相互联系的有关知识.对于大型数据库来说,有算法的执行时间太长等问题.分析和探讨了Apriori算法,提出了基于Apriori算法的一种有效的关联规则挖掘算法,减少了数据库I/O操作时间,从而提高了效率. 相似文献