首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
一种无冗余的关联规则发现算法   总被引:11,自引:0,他引:11  
关联规则是数据挖掘的重要研究内容之一,而传统算法生成的关联规则之间存在着大量的冗余规则。本文提出了一种通用的由量大频繁项目集生成无冗余关联规则的GNRR算法,利用规则之间的冗余关系,按一定顺序挖掘不同的规则,消除了规则之间的冗余性,使发现的规则数目呈指数倍减少。  相似文献   

2.
一种基于闭项集的无冗余关联规则挖掘方法   总被引:1,自引:0,他引:1  
针对关联规则挖掘中存在的规则数量过多,难于理解和应用的问题,提出了一种基于闭项集的无冗余关联规则挖掘算法.首先,给出了无冗余关联规则的定义,并基于规则信任度的概念说明了该定义的合理性;其次,在生成子、闭项集和无冗余关联规则的基础上,给出了无冗余最小-最大精确规则基和无冗余最小-最大近似规则基的定义,并讨论了它们的剪枝策略.最后,讨论了生成子的性质及连接策略,并在包含索引的基础上,给出了一种宽度优先的无冗余关联规则挖掘算法.实验结果表明,本文提出的算法不仅可以发现规模较小的无冗余关联规则,提高了挖掘结果的可理解性,而且具有较高的挖掘效率.  相似文献   

3.
关联规则是数据挖掘的一个基本方法,本文首先介绍传统的Apriori算法的过程,分析它在处理大数据集时存在的问题.提出关联规则的一种改进算法,称为哈希修剪算法.然后比较改进的算法与传统的Apriori算法在算法时间复杂度、性能上的差异.通过实验得出,哈希修剪算法在数据挖掘中能够更加有效的处理数据.  相似文献   

4.
关联规则挖掘方法的改进   总被引:3,自引:2,他引:3  
分析了关联规则的衡量标准,针对其中的缺点和不足,提出了一种匹配度方法用以取代置信度,并将匹配度方法生成的规则与支持度-置信度框架生成的规则进行了比较.结果表明:用匹配度方法生成的规则不仅前件和后件具有较高的相关性,而且减少了冗余规则的生成.  相似文献   

5.
首先介绍了由Christian Hidber提出的在线挖掘关联规则算法Carma,然后提出了对该算法的若干改进.减弱了原算法第一步中当前交易的子集v被插入集合V的条件,同时改进了maxMissed的计算公式,使其计算更为简单.实验表明,以上改进提高了算法的速度.  相似文献   

6.
基于领域知识的冗余关联规则消除算法   总被引:1,自引:0,他引:1  
关联规则挖掘算法用于从大型数据库中提取感兴趣的规则,然而,在领域知识中已经能清晰表示的知识并没有被充分考虑,关联规则挖掘算法提取的规则中包含了大量已知的关联性,从而产生了很多冗余规则.文章提出一种算法DKARM,同时考虑了数据本身以及相关的领域知识,以消除在领域知识中清晰表示的已知关联性.实验表明,该算法合理消除了冗余规则,有效降低了规则数目.  相似文献   

7.
提出一种从大型数据库中挖掘关联规则的快速算法——自适应快速关联规则提取算法。该算法以经典的Apriori算法及其他各种优化算法为基础,引入了自适应步长和扫描树的概念,并采用修剪法对Apriori算法进行了改进。理论分析与实验结果表明,该算法比Apriori算法的应用效率高,同时也证实了其有效性。  相似文献   

8.
VSS-MASK算法使用数据随机化方法对原始数据进行数据变换,采用纵向结构组织数据与只提交变换后为'1'的数据组成的数据表的方法,克服了原MASK算法中横向组织数据造成的数据稀疏性强、通用性差的缺点,并通过试验证明了VSS-MASK算法效率的提升.  相似文献   

9.
数据挖掘中IUA算法存在遗漏频繁项目集致使有的关联规则挖掘不出来的问题,本文对其产生的原因进行了分析和讨论,提出了改进的方法,同时给出一种更为高效的关联规则更新算法HIUA。  相似文献   

10.
对海量的时间序列进行处理,挖掘其背后蕴涵的价值信息具有重要的意义。本文结合了时序逻辑和数据挖掘的知识对基于FP_树的时序关联规则展开了研究,并在传统的算法基础上提出了一种改进算法。该方法不用生成大量的频繁模式候选集,从而提高了时序关联规则的挖掘效率。  相似文献   

11.
采用χ2相关性检验和有趣度量定义了两种可能的“unexpected”规则, 对关联规则挖掘的裁剪与优化问题给出一个比较全面和系统的解决方法, 并结合规则裁剪提出了完整的算法思想, 通过对实验数据的关联挖掘, 挖掘出有效、 新奇和意想不到的规则. 实验结果表明, 该优化方法具有良好的有效性和伸缩性.  相似文献   

12.
关联规则发现的一种改进算法   总被引:7,自引:0,他引:7  
在Apriori算法基础上,给出一个改进的关联规则发现算法·由于这个算法只需对交易数据库进行一次搜索,能大量减少所需的I/O次数,且内存开销适中,因此同其他关联规则发现算法相比具有快速的优点,适合于大型交易数据库·使用合成数据作试验表明这个算法尤其对大型数据库的性能优于先前已有的一些关联规则算法·  相似文献   

13.
一种基于改进型遗传算法的关联规则提取算法及其应用   总被引:3,自引:0,他引:3  
对关联规则的数据挖掘和遗传算法进行了概述,阐述了关联规则数据挖掘的现实意义,提出了一种采用改进型遗传算法的关联规则提取方法,并给出了具体的算法,最后结合一个具体实例进行了应用。  相似文献   

14.
一种挖掘负关联规则的有效方法   总被引:1,自引:1,他引:1  
负关联规则表示2个项集之间的互斥或否定关系,往往隐藏在数量庞大的非频繁项集中,有很强的相关性且包含了重要的信息.提出了一种基于相关系数和最小兴趣度的挖掘负关联规则的方法,并给出了相应的算法,实验表明该算法能有效提高挖掘效率.  相似文献   

15.
一种高效相联规则提取算法   总被引:3,自引:0,他引:3  
在 Apriori 算法基础上, 提出改进算法 Apriori Pro. 利用中间结果对数据库进行过滤,从而加快候选项集的计数速度, 提高了整个算法的效率.  相似文献   

16.
关联规则是数据挖掘的一个重要研究内容,主要用于从大量数据集中挖掘出有价值的数据项之间的关联关系.典型案例是超市的购物篮分析,主要对顾客的购买记录数据库进行关联规则挖掘,可以发现顾客的购买行为.本文依据Apriori算法的两个基本性质,即任何大项集的子集一定是大项集,非大项集的超集一定是非大项集,对经典的Apriori算法要多次扫面事务数据库的问题,作了一些改进,并进行仿真计算,结果表明,改进的算法确实减少了扫描次数.  相似文献   

17.
在Apriori算法基础上,给出一个改进的关联规则挖掘算法。改进的算法只需对数据库进行一次搜索,能大量减少L/O次数,且内存开销适中。通过一组实验对两种算法进行比较,本算法尤其对大型数据库的性能优于先前已有的一些关联规则算法。  相似文献   

18.
基于支持格的关联规则挖掘算法   总被引:1,自引:0,他引:1  
提出了一种基于支持格的关联规则挖掘算法(ARSL),该算法连续扫描数据库事务序列,逐步构造支持格,对数据库扫描不超过2遍即可求得所有大项目集。首次扫描数据库时,能提供反馈信息,允许用户对最小支持率进行调整。该算法能连续处理事务序列,可用于网上在线数据挖掘。  相似文献   

19.
对数据挖掘关联分析的剪裁   总被引:1,自引:0,他引:1  
利用属性间的相互关系对关联分析进行剪裁,针对关联分析会得到过多的属性间关系这一问题,分析了影响关联分析结果的诸多因素,提出了对包容关系,递推关系以及互递关系的剪裁算法,经实例运算表明,新算法能有效地剪裁关联分析所得到的结果关系集合,在此基础上,对几种关系剪裁算法进行了比较和讨论,并提出了一些改进设想。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号