共查询到20条相似文献,搜索用时 109 毫秒
1.
多最小支持度下的关联规则及其挖掘方法研究 总被引:4,自引:0,他引:4
数据挖掘指的是从大量的数据中提取隐含的、事先未知的、并且潜在有用的知识技术,是目前国际上数据库和信息决策领域最前沿的研究方向之一。关联规则是当前数据挖掘研究的主要领域之一,获取具有更高价值的规则是该领域的一个研究重点。针对目前大多数挖掘算法只能发现单一支持度下的关联规则问题,文中提出了一种基于多支持度的挖掘策略及在原有AprioriTid算法基础上的改进算法。 相似文献
2.
基于多支持度的挖掘加权关联规则算法 总被引:6,自引:0,他引:6
关联规则挖掘是数据挖掘中一个重要的模型.在其挖掘算法中,如果最小支持度很高,则出现频率比较低的规则就不能发现;如果最小支持度太低,因为频繁项的相互关联,则会出现组合爆炸.为此,提出了允许用户设定多个最小支持度、给定数据各项的权重来解决这一问题.理论、实验数据和实际应用证明,该新算法可行且符合实际情况,比同类算法用时更少,对大型数据库的关联规则挖掘非常有效. 相似文献
3.
针对实际交易数据库中,不同项目的重要性和出现概率各不相同的两个问题,提出一种基于等价类和多最小支持度的加权关联规则算法,从而挖掘出那些覆盖较少数据但却有意义、用户可能更感兴趣的关联规则。算法按照项目的最小支持度升序对交易记录进行等价类划分,然后按照项目的最小支持度降序依次求出每一等价类内的加权频繁项集。算法采用垂直数据库的数据表示形式,挖掘过程中避免了对数据库的重复扫描。对比实验结果证明,改进算法具有良好的挖掘性能。 相似文献
4.
现实量化交易应用中,传统的模糊数据挖掘算法往往需要针对给定的量化交易设定最小支持度阈值,然而,这些方法中存在的普遍问题是很难找到合适的最小支持度阈值,并且因为推导出的规则通常是常识而没有实际的商业意义。为了解决这个问题,提出了一种无需最小支持度阈值的模糊关联规则(fuzzy coherent rule,FCR)挖掘算法。首先将量化交易转换成模糊集,然后通过收集已经生成的模糊集生成候选模糊关联规则,最后计算出列联表并用其检查这些候选模糊关联规则是否满足四项判断准则。如果满足,则可以确定为模糊关联规则。在Foodmart数据集上的实验验证了所提算法的有效性,相比原始模糊关联规则(fuzzy association rules,FAR)挖掘算法,所提的FCR方法能够推导出更多的规则,并且能够在高置信度时推导出更多有用的规则。 相似文献
5.
为了解决在关联规则挖掘Apriori算法中最小支持度阀值设定难或设定不适当的问题,基于事务普遍具有统计规律性,设计了平均值调优的方法。为支持度和预选率划分不同区间,利用平均值进行最小支持度阀值的调优。对于不同分布特征的事务数据库,该方法比原先设定阀值都能取得更好的频繁项集结果,同时不会产生过大的性能开销。 相似文献
6.
7.
8.
运用数据挖掘技术研究钻井作业事故隐患的分布规律及其内在机理,是迫切需要解决的重要课题。针对冗余、复杂的钻井隐患数据在挖掘过程中频繁项集丢失及其生成效率低的问题,提出一种基于支持度矩阵的Apriori算法。首先,引入布尔矩阵来表示事务数据库,避免了数据库的重复扫描。其次,通过事务矩阵相乘构造支持度矩阵来获得支持度从而简化支持度计算方法。最后,对算法的连接策略进行优化,简化了频繁项集的生成过程,且在运算过程中不断约简矩阵结构。在UCI数据集上进行实验,证明了改进后的Apriori算法能有效地提高执行效率。将该算法应用于钻井历史隐患数据的关联挖掘,挖掘结果能为安全管理者提供科学的决策依据,实现对钻井作业事故隐患有效识别和风险控制,具有重要意义和推广应用价值。 相似文献
9.
10.
关联规则挖掘是从大量的数据中挖掘出有价值描述数据项之间相互联系的有关知识.对于大型数据库来说,有算法的执行时间太长等问题.分析和探讨了Apriori算法,提出了基于Apriori算法的一种有效的关联规则挖掘算法,减少了数据库I/O操作时间,从而提高了效率. 相似文献
11.
挖掘关联规则Apriori算法的一种改进 总被引:1,自引:0,他引:1
本研究在对Apriori算法分析的基础上,提出了改进的Apriori算法。改进后的算法采用矩阵表示数据库,减少了扫描事物数据库的次数;利用向量运算来实现频繁项集的计数,同时及时地去掉不必要的数据,减少了数据运算,从而提高了算法的运行效率。 相似文献
12.
提出了一种基于权函数的改进型关联规则算法——CWA priori算法。该算法利用决策属性在挖掘中的作用,归约数据源中无价值或价值较小的记录,从而缩短程序运行时间和节约数据存储空间,较好地改进了算法性能。实验结果证明CWA priori算法的效率明显高于A priori算法。 相似文献
13.
朱彦廷 《西昌学院学报(自然科学版)》2010,24(3):60-62,67
根据关联规则挖掘的要求,结合遗传算法的特点,提出了一种基于遗传算法的关联规则挖掘算法,在基本遗传操作选择、交叉、变异的基础上,引入了挑选操作,取消了交叉、变异概率,给出了详细的算法设计及描述,并通过实例证明了算法的性能。 相似文献
14.
关联规则是数据挖掘的重要手段,它基于支持度、置信度等对规则进行筛选,生成有用的规则。关联规则反映了大量数据中项集之间的相互依存性和关联性。Apriori算法和FP-Growth算法是关联规则挖掘中的两个典型算法。本文阐述了这两种算法的基本思想、数据挖掘步骤,并讨论了它们的优缺点及差异。 相似文献
15.
通过对Apriori算法的分析,提出了一种关联规则挖掘的改进算法Apriori_Q。该改进算法减少了模式匹配和对数据库访问的次数,理论分析与实验结果表明,Apriori_Q提高了关联规则生成的效率,因而更具有实用价值。 相似文献
16.
网站日志记录了用户的浏览行为,通过挖掘网站日志,可以分析用户行为,为优化网站结构提供有价值的数据.但是很多虚拟主机网站没有日志记录功能,这给日志挖掘带来了极大的不便.本文介绍一种生成日志的方法,并利用关联规则算法对其进行日志挖掘,发现用户的访问模式,帮助网站改进页面结构. 相似文献
17.
传统的关联规则挖掘技术是从包含一组事务记录的数据库中发现一些事务项目间关系的信息。本文的工作,是致力于将关联规则的概念引入到Web日志挖掘系统中,将用户的访问路径以关联规则的形式表现出来,其目的在于从用户访问超文本系统的行为中发现用户的访问模式。将超文本系统看成是一种有向加权图,经过对可信度和支持度的重新定义,使之适合于用来表示用户的访问路径,并引出复合关联规则挖掘算法。 相似文献
18.
19.
黄发良 《福建师范大学学报(自然科学版)》2010,26(6)
分析了关联规则传统挖掘方法在应答型数据应用领域中的不足,定义出应答试题与应答者的信息量度量策略,在此基础上提出一种新的基于信息量的关联规则挖掘算法. 相似文献
20.
关联规则挖掘方法自提出以来已有很多改进算法,但均局限于布尔关联规则的挖掘.已有的数量关联规则挖掘主要考虑了连续属性值离散化、最优的数量关联规则挖掘等问题,但存在过小支持度和过小置信度问题.研究了这一问题并提出了一个在频繁2-项集的基础上挖掘数量关联规则的改进算法.它不仅可以用于典型的购物篮分析,还可以用于购物篮分析不能完成的关联规则挖掘问题,如带数量的捆绑销售问题. 相似文献