共查询到20条相似文献,搜索用时 203 毫秒
1.
阐述了关联规则挖掘对象事务数据库的特性, 对关联规则挖掘的关键问题频繁项集的几种挖掘方法:Apriori算法、最大频繁项集的挖掘算法、基于频繁链表的频繁项集挖掘算法作了分析研究,并指出了频繁项集挖掘算法优化的必要途径 相似文献
2.
从大型事务数据库中发现关联规则是数据挖掘中的一个重要课题,其核心问题是挖掘频繁项集.经典Apriori算法是有效的挖掘频繁项目集的算法.在分析Apriori算法的基础上,提出了一种利用二维数组来代替算法中的哈希树的方法,可以迅速产生二阶频繁项目集,改善了Apriori算法的效率瓶颈,大大提高了算法的执行效率. 相似文献
3.
Apriori算法是关联规则数据挖掘领域中最重要的挖掘方法,针对Apriori算法中挖掘频繁项集的效率问题和产生关联规则的合理性问题,改进相关定义及其使用,并提出改进的Apriori算法,然后将改进算法用于教学评价仿真系统.仿真结果表明,改进算法可高效、合理地挖掘关联规则,为做好课程安排和教学工作提供支持. 相似文献
4.
5.
基于线性链表存储结构的Apriori改进算法 总被引:1,自引:1,他引:0
Apriori是最有影响的挖掘关联规则频繁项集的算法。但是Apiori由于需要多次对数据库进行扫描,所以运行效率比较低。在Apriori算法的基础上,本文提出了一种基于线性链表的频繁项集挖掘算法,实验证明该算法能够有效提高执行效率。 相似文献
6.
7.
基于数据挖掘关联规则Apriori改进算法的入侵检测系统的研究 总被引:1,自引:1,他引:0
在众多的关联规则挖掘算法中,Apriori算法是最为经典的一个,但Apriori算法有以下缺陷:需要扫描多次数据库、生成大量候选集以及迭代求解频繁项集。因而提出了一种新方法,使Apriori算法产生的候选项集再通过数据库查找是否为频繁项集,从而提高算法的效率。最后针对入侵检测系统形成关联规则。实验结果表明,改进后的算法... 相似文献
8.
介绍了关联规则挖掘的情况,并在分析关联规则的数据挖掘算法的基础上,提出一个改进的Apriori算法.新算法仅对数据库扫描一次,就能找出所有的频繁项集,从而提高了挖掘的效率,具有一定的实用性 相似文献
9.
频繁项集的挖掘效率是关联规则产生的关键.针对经典Apriori算法的瓶颈,提出一种改进算法,通过数组结构来保存项集信息,只须扫描一遍数据库减少了时间开销.在自连接前进行项目计数,减少参加连接的项集数量,减少了候选项集的数量.通过实例证明,改进算法的效率更高. 相似文献
10.
沈良忠 《温州大学学报(自然科学版)》2009,30(6):25-30
针对关联规则挖掘中传统Apriori算法需要通过多次扫描数据库来发现频繁项集的问题,提出一种基于简单双矩阵的方法来实现频繁项集的发现.该方法仅需要扫描数据库一次,并充分利用项集的出现次数和是否出现逻辑值来获取频繁项集.实验表明,该方法比Apriori算法更高效. 相似文献
11.
具有动态加权特性的关联规则算法 总被引:8,自引:1,他引:7
基于FP_growth关联规则, 提出一种具有动态加权特性
的改进算法. 把事务数据库中的项目按其重要程度划分为5个等级; 运用层次分析(AHP)算法
构造判断矩阵, 计算特征向量; 将得到的向量作为权值, 与项目在事务数据库中出现的次数
综合考虑作为衡量重要程度的标准, 生成FP_tree; 最后得到频繁项目集和关联规则. 由于
权重的赋予过程可以由领域专家动态地改变, 这样不但能挖掘出更有意义的规则, 而且在算
法的运行初期就大量剔除了那些权重小的无用项目集, 从而大大提高了算法的运行效率. 相似文献
12.
通过对隐私保护频繁项集挖掘问题的研究,发现现有的单参数随机化回答模型调控的数据范围宽、粒度粗,导致无法实现精细化、差异化的隐私保护的问题.在沃纳模型、单参数等随机化模型的基础上,提出个体分组多参随机化PN/g模型,给出其在隐私保护频繁项集挖掘中的支持度重构方法.研究结果表明:该模型面向多样化、差异化的隐私保护需求,将N个不同个体分为若干组,每组设置不同的随机化参数,可实现差异化的隐私保护效果.实例分析表明:结合所提出的支持度重构方法,可实现基于分组随机化的隐私保护频繁项集挖掘,在保护不同群体隐私的同时,挖掘到有效的频繁项集与关联规则. 相似文献
13.
针对传统的关联规则在试卷评估中应用出现的问题:由于试题的难易程度不同,被答对的概率也不一样,即数据集中数据项发生的概率不一样,数据项具有倾斜支持度分布的特征,选择合适的支持度阈值挖掘这样的数据集相当棘手。文章提出了基于试题难度系数加权的关联规则挖掘算法,从而解决因试题难度不同而导致数据项出现的概率不均的问题,发现更多有趣的关联规则,并且理论上证明了基于难度系数的加权关联规则算法保持频繁项集向下封闭的重要特性。 相似文献
14.
为了解决缺省关联规则的增量挖掘问题,在算法DRMBAR的基础上,结合粗糙集理论及频繁模式树结构,提出了一种基于关联规则的缺省规则更新算法IADRBAR,该算法主要考虑最小支持度发生变化时缺省规则的更新问题,即在新的最小支持度下,如何高效地生成新的关联规则. IADRBAR在最坏的情况下仅须扫描决策表一遍,并利用上一次已经挖掘出的频繁项目集及关联规则,有效地提高缺省规则的更新效率.理论分析和实验结果表明算法是有效可行的. 相似文献
15.
在挖掘最大频繁项目集的过程中,通过改变最小支持度阈值可以挖掘更有用的最大频繁项目集,为此提出了一种最大频繁项目集更新挖掘算法UAMMFI(Updating Algorithm for Mining Maximal Frequent Itemsets)。算法基于改进后的频繁模式树结构,在更新挖掘过程中,不需产生候选项目集和条件模式树,并且充分利用先前已挖掘的最大频繁项目集中包含的信息,快速更新挖掘出最小支持度阈值变化后的最大频繁项目集。实验结果表明,算法能够高效更新挖掘最大频繁项目集。 相似文献
16.
指出了时序关联规则在支持度度量上的不足,存在处理高密度海量数据时往往要耗费大量的时间处理规模巨大的频繁候选集,同时需要多次重复扫描数据库,执行效率低等问题,提出了重新定义支持度度量方法的时序关联规则.针对时序关联规则在解决项分类时涉及到的分层不确定、不准确情形,引入了基于隶属度的模糊层次分类结构,定义了项间距离、项集间距离,最终得到一种新的关联规则间距离的度量方法.实现了模糊层次分类,将时序关联规则结果进行聚类分析,得到规则和规则之间相似性,实验验证了该方法的有效性. 相似文献
17.
针对实际交易数据库中,不同项目的重要性和出现概率各不相同的两个问题,提出一种基于等价类和多最小支持度的加权关联规则算法,从而挖掘出那些覆盖较少数据但却有意义、用户可能更感兴趣的关联规则。算法按照项目的最小支持度升序对交易记录进行等价类划分,然后按照项目的最小支持度降序依次求出每一等价类内的加权频繁项集。算法采用垂直数据库的数据表示形式,挖掘过程中避免了对数据库的重复扫描。对比实验结果证明,改进算法具有良好的挖掘性能。 相似文献
18.
快速关联规则挖掘算法 总被引:1,自引:0,他引:1
提出了一种新颖的关联规则挖掘算法QAIS,与经典两阶段式关联规则挖掘算法不同的是,它只需扫描一遍事务数据库,不需要生成候选集,并且可以方便的应用在增量式关联规则挖掘算法中,该算法经合成数据验证是有效的.同时针对关联规则生成过程中出现大量冗余规则的问题,还讨论了冗余关联规则去除的问题. 相似文献
19.
基于量化概念格的关联规则挖掘 总被引:4,自引:0,他引:4
在概念格的内涵中引入等价关系并将其外延量化 ,得到量化概念格。利用量化概念格可以清晰地表示知识 ,从而便于挖掘包括关联规则在内的多种规则 ,与经典的 A priori算法相比较 ,规则表示更简捷、直观 ,尤其重要的是用户可根据自己的兴趣交互地挖掘关联规则 ,不需要计算频繁项目集 ,因而提高了挖掘规则的效率 ,适用于大型数据库中关联规则的挖掘 相似文献
20.
基于有向图的关联规则算法 总被引:5,自引:0,他引:5
提出了一种基于有向图的关联规则挖掘算法,采用了垂直二进制位图映射数据库,根据垂直二进制位图来生成有向图,将频繁项的二进制位串作为有向图的权值,通过分析有向图生成最大频繁项集,并给出了最大频繁项集挖掘算法的优势。 相似文献