首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 77 毫秒
1.
关联规则挖掘在许多数据挖掘中有着广泛的应用。当数据库和支持度阈值发生变化时,现有的挖掘方法普遍存在多次扫描数据库或重复遍历复杂数据结构的问题。该文基于增量式更新算法(IUA)和快速更新算法(FUP),提出在数据库与支持度阈值同时变化情况下的关联规则动态维护算法ARDM,并通过Hash结构与模式增长方法进行优化。实验表明:该算法充分利用了已挖掘结果,在数据库和支持度阈值同时变化时比FP-Growth大幅提高了执行效率。最后,将该算法应用于企业财务指标及财务比率分析。  相似文献   

2.
针对经典挖掘算法挖掘效率低、主观性强、生成关联关系过多的问题,从样本筛选和关联规则生成两个方面提出一种面向高维数据关联规则挖掘的新型算法(mining multidimensional association rules by combination, Marc)。所提算法通过计算样本的分布系数和删除阈值,综合自定义支持度在初读数据集时对样本进行双重筛选,在挖掘之初降低弱样本影响。在频繁项和关联规则生成时以样本关系表和样本全关系组合模式挖掘信息,降低挖掘过程的复杂性和资源消耗。试验结果表明:Marc算法挖掘出的频繁项和关联规则数量显著降低,在挖掘效率和内存消耗上均优于Apriori、FP-Growth和Eclat算法,且维度越高,数据集越大,优势越明显,Marc算法频繁项和关联关系挖掘的精度为100%。  相似文献   

3.
网络数据包安全指标关联规则挖掘应用与研究   总被引:2,自引:2,他引:0  
对网络通信中,安全指标间关联规则的挖掘速度缓慢问题进行研究。网络通信数据的高容量、多样性和复杂性,使网络安全指标间关联规则挖掘的信息处理难度较高、时间效率低,为此提出一种基于并行FP-树频集算法的关联规则数据挖掘方法并成功应用于网络通信的安全指标挖掘中。首先对网络通信数据进行Netflow流量数据采集,对其进行预处理以信息熵的形式存储。然后将频集压缩到频繁模式树上,再引入并行算法在多个处理器上为频繁模式树的节点创建条件模式库和条件模式树,在不同的并行处理器上进行同时处理,最后生成反映网络安全信息的关联规则。该方法提高了网络信息安全指标间关联规则挖掘的效率,在同样的支持度阈值和置信度阈值的条件下,可减少处理时间4~7 s。  相似文献   

4.
针对使用传统关联规则算法挖掘大数据集时,挖掘过程中效率不高,挖掘出大量冗余规则的问题,提出了基于关联规则和相似度的数据挖掘算法(U-APR):首先,一次性读入数据并构建矩阵,并利用关联规则支持度度量的特性来增加判断属性,以加快结束迭代过程,从而改进了Apriori算法频繁扫描数据库问题;然后,使用相似度算法去除冗余的关联规则;最后,结合置信度、支持度和用户目标匹配度对挖掘结果进行排序输出,从而得到用户感兴趣的关联规则. 同时,应用该算法与目前常用的2种关联规则算法对广东某高校学生财务数据进行数据挖掘. 实验结果表明:与2种常用的关联规则算法相比,U-APR算法缩短了运算时间和提高了存储空间利用率,对用户分析挖掘结果有较好的优化效果.  相似文献   

5.
关联规则挖掘是数据挖掘技术的一种简单又很实用的方法,有着广泛的应用。该文利用部分支持度树的结构提出了对关联规则的增量式更新算法,用于解决向数据库中添加新的数据而最小支持度不发生变化时的关联规则更新问题。该算法有效地利用已挖掘的关联规则和保留的部分支持度树来改善性能,并且只需对新增数据库部分进行一遍扫描,从而进一步提高算法的效率。实验结果表明,该算法能有效地解决关联规则的更新问题,提升挖掘效率。  相似文献   

6.
为了便于用户浏览网页信息,基于全置信度关联分析,提出了一种网页层次聚类的方法。该方法采用向量空间模型表示网页文档,将文档看成事务,文档的词汇视为事务中的项,根据关联挖掘算法发现文档之间的强关联规则产生基本类,然后利用图划分的算法完成网页文档的层次聚类。在关联规则产生过程中采用全置信度量发现强关联模式,规则的产生不受支持度阈值设置的影响,即使支持度闽值设置为零,也能发现强关联模式,有效地消除了弱相关的交叉支持模式。  相似文献   

7.
基于数据立方体的维内关联规则挖掘算法   总被引:5,自引:0,他引:5  
针对数据立方体的结构特点,结合联机分析处理技术,提出了两种基于数据立方体的维内关联规则挖掘算法,以合肥农河超市实际数据作为测试数据,给出了两种算法的实验结果,结果表明,两种算法在不同支持度情况下执行效率存在明显差异,分别适合在高支持度和低支持度情况下进行关联规则挖掘。  相似文献   

8.
关联规则的挖掘是数据挖掘领域的重要研究内容之一.关联规则的挖掘算法大都在用户设置的支持度阈值的限制条件下,挖掘出数据属性之间的关系.但是没有相关领域的专门知识,用户很难设置合适的支持度阈值得到合适的结果.本文在Apriori算法的基础上,提出一种无支持度的关联规则挖掘方法.  相似文献   

9.
刘晓蔚 《科学技术与工程》2013,13(26):7667-7674
现实量化交易应用中,传统的模糊数据挖掘算法往往需要针对给定的量化交易设定最小支持度阈值,然而,这些方法中存在的普遍问题是很难找到合适的最小支持度阈值,并且因为推导出的规则通常是常识而没有实际的商业意义。为了解决这个问题,提出了一种无需最小支持度阈值的模糊关联规则(fuzzy coherent rule,FCR)挖掘算法。首先将量化交易转换成模糊集,然后通过收集已经生成的模糊集生成候选模糊关联规则,最后计算出列联表并用其检查这些候选模糊关联规则是否满足四项判断准则。如果满足,则可以确定为模糊关联规则。在Foodmart数据集上的实验验证了所提算法的有效性,相比原始模糊关联规则(fuzzy association rules,FAR)挖掘算法,所提的FCR方法能够推导出更多的规则,并且能够在高置信度时推导出更多有用的规则。  相似文献   

10.
利用Rough集理论中关于等价类的概念,提出了单维布尔关联规则问题挖掘算法,考虑到关联规则设定单一最小支持度阈值的局限性,提出使用多个最小支持度的办法进行频繁项集的发现,利用兴趣度对单维布尔关联规则进行评价.  相似文献   

11.
数据挖掘中IUA算法存在遗漏频繁项目集致使有的关联规则挖掘不出来的问题,本文对其产生的原因进行了分析和讨论,提出了改进的方法,同时给出一种更为高效的关联规则更新算法HIUA。  相似文献   

12.
在数据库中挖掘关联规则是数据挖掘领域的一个重要的研究课题,在应用中具有非常重要的意义.在分析Apriori算法和IUA算法经典关联规则挖掘算法的基础上,提出了一种基于最近挖掘结果的更新算法称为IIUA.IIUA算法吸收了Apriori算法和IUA算法的优点,在改变最小支持度和基于最近挖掘结果的条件下,从生成尽可能少的候选项集考虑,得到完整的新频繁项集,从而提高算法的效率.  相似文献   

13.
针对传统的关联规则在试卷评估中应用出现的问题:由于试题的难易程度不同,被答对的概率也不一样,即数据集中数据项发生的概率不一样,数据项具有倾斜支持度分布的特征,选择合适的支持度阈值挖掘这样的数据集相当棘手。文章提出了基于试题难度系数加权的关联规则挖掘算法,从而解决因试题难度不同而导致数据项出现的概率不均的问题,发现更多有趣的关联规则,并且理论上证明了基于难度系数的加权关联规则算法保持频繁项集向下封闭的重要特性。  相似文献   

14.
提高最大频繁项目集挖掘算法的效率是关联规则挖掘研究一个重点领域。本文主要对影响最大频繁项目集挖掘效率的数据分布、搜索策略、支持度计算及剪枝策略等技术进行研究。  相似文献   

15.
提出了推荐模型中的关联规则挖掘方法的改进,给出了自定义的页面权值的定义,并改进了基于关联图的关联规则挖掘算法,将页面权值应用于关联规则的挖掘中。此算法是利用Web日志中经过预处理后得到的数据进行规则挖掘,将处理后的数据应用正态分布函数来得到页面权值。用页面权值重新计算支持度,最后将得到的支持度应用于改进的规则挖掘算法中,形成一种基于权值的关联图的关联规则算法。  相似文献   

16.
王娟 《科技信息》2011,(33):56-56,45
关联规则是数据挖掘的重要手段,它基于支持度、置信度等对规则进行筛选,生成有用的规则。关联规则反映了大量数据中项集之间的相互依存性和关联性。Apriori算法和FP-Growth算法是关联规则挖掘中的两个典型算法。本文阐述了这两种算法的基本思想、数据挖掘步骤,并讨论了它们的优缺点及差异。  相似文献   

17.
张俊 《长春大学学报》2014,(12):1666-1670
首先简单介绍了几种经典的数据挖掘领域的算法,考虑到这些算法的优缺点及其应用领域,本文采用关联规则挖掘算法。由于Apriori算法的各种变形可用于提高算法效率和可伸缩性,最后选择采用单维单层布尔型的关联规则的Apriori算法。本文对Apriori算法进行了扼要的介绍,并根据其算法的原理详细地设计了基于Web的分布式数据挖掘隐私保护方法。  相似文献   

18.
提出一种有效的基于频繁闭项目集的关联规则挖掘算法RIFCI.该算法采用挖掘频繁项目闭集取代传统的频繁项目集,同时在项目集和事务集中展开搜索.通过对UCI机器学习库中10个数据集的测试,与工业标准C4.5比较,错误率低于19.48%,在准确度不变的情况下,生成规则数目低于传统算法,提高了算法的效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号