共查询到20条相似文献,搜索用时 76 毫秒
1.
关联规则挖掘的AprioriTid算法的改进 总被引:1,自引:0,他引:1
关联规则挖掘是数据挖掘中常见的一种形式。高效地找出频繁项目集是关联规则挖掘的中心问题.文章在分析生成频繁项目集的AprioriTid算法的基础上,指出了算法中存在由于项目的重复存储而使数据量偏大的问题,提出并证明了“Ck—l中支持率小于minsupport的项目集在Ck-1中是无用的”的定理。并以此为依据改进了算法.实验表明,改进算法在缩小数据规模方面是行之有效的. 相似文献
2.
数据挖掘中关联规则挖掘算法的改进及其应用 总被引:3,自引:0,他引:3
对数据挖掘技术中经典的关联规则挖掘算法Apriori和AprioriTid进行了分析,针对其中不足,提取两种算法的优点,给出了算法的改进,并在贵州电力综合数据平台中进行了应用分析。 相似文献
3.
一种高效关联规则挖掘算法 总被引:1,自引:0,他引:1
为了提高关联规则挖掘算法处理数据库的效率,在研究AprioriTid算法的基础上提出一种高效的关联规则挖掘算法AprioriTidD,在计算数据库中的频繁项集时依靠有效的裁剪减少无效项集的产生,并且可减少产生候选项集,从而有效地提高算法的效率.选取程序模拟超市购物产生的3个试验数据集,应用AprioriTidD算法对该... 相似文献
4.
介绍了由ChristianHidber提出的在线挖掘关联规则算法Carma,提出了该算法的若干改进,减弱了原算法第一步有交易的子集v被插入集合V的条件,同时改进了maxMissed的计算公式,使其计算更为简单。实验证明,以上改进提高了算法的速度。 相似文献
5.
焦亚冰 《太原师范学院学报(自然科学版)》2008,7(2):103-106
数据挖掘应用极大地推动了人们掌握、处理信息的能力.文章主要介绍了数据挖掘中的关联规则,关联规则中的经典算法Apriori算法,以及Apriori算法存在的不足,提出了Apriori算法的改进研究. 相似文献
6.
7.
在分析广义关联规则基本模型和求解在规则的基本性质基础上,提出一个新的基于关系操作的挖掘广义关联规则算法,该算法既使用了成熟的关系操作又充分利用先验,在多概念层上交互挖掘关联规则,有很好的实用性。 相似文献
8.
介绍了关联规则挖掘算法的基本原理,并按照挖掘中涉及到的变量数目(维数)、数据的抽象层次和处理变量的类别(布尔型和数值型),依次对关联规则挖掘算法的研究进行综述,并对一些典型的算法进行分析和比较,最后展望了关联规则挖掘算法的研究方向。 相似文献
9.
多层次关联规则的快速挖掘算法 总被引:1,自引:0,他引:1
数据挖掘被认为是解决“数据爆炸”和“数据丰富,信息贫乏”的一种有效方法。关联规则是数据挖掘的重要研究方向。本文提出了多层次关联规则的一种快速挖掘算法,利用抽样从概念层次树的中间开始挖掘,以提高挖掘的速度。 相似文献
10.
洪少春 《辽宁师专学报(自然科学版)》2005,7(4):31-33,83
关联规则挖掘是目前数据挖掘的研究难点之一,介绍了关联规则的划分情况,对频集算法进行了改进,提出了处理数值型字段的基本方法,展望了关联规则挖掘的未来研究方向. 相似文献
11.
关联规则在课堂教学评价中的应用 总被引:7,自引:0,他引:7
蒋秀英 《山东师范大学学报(自然科学版)》2003,18(3):25-28
数据挖掘是近年来出现的一种综合了机器学习、统计学、数据库等众多领域的新技术.而关联规则是数据挖掘的核心技术,应用广泛.本文将数据挖掘中的关联规则算法应用于学校课堂教学评价中,找出了课堂效果与教师职称、年龄之间内在的关联规则,可以有效地指导教学工作。 相似文献
12.
在挖掘关联规则的过程中,关键步骤是产生频繁项集.基于频繁项集支持矩阵的思想,提出一种有效的频繁项集挖掘算法-FIMA,并给出了算法的基本设计思想和算法描述.本算法利用矩阵挖掘频繁项集,不需要产生候选项集,且只需扫描数据库一次。所以此算法是非常有效的. 相似文献
13.
在对经典的关联规则算法进行了分析后,通过引入多维链表结构,提出了利用事务集合匹配运算和链表操作高效地挖掘关联规则的算法ARM LL.实验结果表明该算法是可行的,并具有较高的效率. 相似文献
14.
提出了一种采用遗传算法挖掘关联规则的方法,从编码方法、适应度函数的构造、交叉、变异算子设计等方面进行了讨论.将此方法应用于分析高血压病中医医案诊治数据中,选取了自2008年7月-2010年10月在山东中医药大学附属医院收集的丁书文教授高血压病诊治医案435份为数据来源,实验结果验证了算法的有效性,其中支持度为0.34的强关联规则中的8位药完全包含在丁教授在治疗高血压病时常用的钩藤方中. 相似文献
15.
关联规则挖掘在旅游突发事件预测中的研究 总被引:1,自引:0,他引:1
基于数据挖掘中的关联规则挖掘及Apriori算法,研究了在旅游行业中用挖掘得到的规则对突发事件进行预测的方法.对突发事件进行了预处理,对与突发事件相关的规则进行了挖掘,提出了改进的关联规则算法,并获得了有意义的规则输出,并对这些关联规则在旅游业的应用进行了研究. 相似文献
16.
Apriori算法是关联规则挖掘中的经典算法,一直是数据挖掘领域的研究热点。传统的Apriori算法由于产生过多的无用的候选项集以及需要多次扫描数据库导致在一定程度上限制了算法的效率。本文针对这一问题,提出一种新的RF-Apriori算法。该算法首先对数据进行二元处理;然后利用项集的反单调性减少候选项集的产生,从而提高算法效率。实验结果表明,RF -Apriori算法效率明显优于Apriori算法。 相似文献
17.
将模糊技术和概念分层应用到关联规则挖掘中,给出了多层次模糊关联规则挖掘系统的设计和实现的具体方案.并以Fnodmark2000数据库为基础,建立了客户信息主题数据库.建立起系统基本框架,实现了模糊关联规则挖掘算法,使用该算法成功挖掘出客户消费—特征之间的关联规则,并对得到的模糊关联规则作了分析。 相似文献
18.
传统的联结规则挖掘算法依赖于一个不现实的假设:用户可以指定最小支持度.如果用户不了解他们的数据库,指定的最小支持度是肯定不适合的.在此设计了一个基于遗传算法的挖掘策略。它具有两个显然的优点:①高性能且自动化的规则挖掘;②不要求用户指定最小支持度。 相似文献
19.
一种改进的负关联规则挖掘算法 总被引:6,自引:0,他引:6
负关联规则A→—B(或者-A→B,-A→B)描述的是项目之间的互斥关系,其与传统的关联规则有着同样重要的作用.然而,负关联规则和传统正关联规则的挖掘有很大不同,因为负关联规则隐藏在数量巨大的非频繁项集中.因此提出一种新的挖掘horn子句类型负关联规则的算法,并且实验证明是行之有效的. 相似文献
20.
针对经典挖掘算法挖掘效率低、主观性强、生成关联关系过多的问题,从样本筛选和关联规则生成两个方面提出一种面向高维数据关联规则挖掘的新型算法(mining multidimensional association rules by combination, Marc)。所提算法通过计算样本的分布系数和删除阈值,综合自定义支持度在初读数据集时对样本进行双重筛选,在挖掘之初降低弱样本影响。在频繁项和关联规则生成时以样本关系表和样本全关系组合模式挖掘信息,降低挖掘过程的复杂性和资源消耗。试验结果表明:Marc算法挖掘出的频繁项和关联规则数量显著降低,在挖掘效率和内存消耗上均优于Apriori、FP-Growth和Eclat算法,且维度越高,数据集越大,优势越明显,Marc算法频繁项和关联关系挖掘的精度为100%。 相似文献