首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
提高频繁项集挖掘算法的效率一直是数据挖掘领域中关联规则挖掘研究的一个重点。Apriori算法是一种经典的最有影响的挖掘关联规则的算法,该算法虽然能有效地挖掘出关联规则,但是产生的冗余规则多,效率低下。针对数据挖掘的现状及关联规则算法的瓶颈问题,提出一种基于串与运算的关联规则挖掘算法,并对关联规则挖掘的未来研究方向进行了展望。  相似文献   

2.
一种基于闭项集的无冗余关联规则挖掘方法   总被引:1,自引:0,他引:1  
针对关联规则挖掘中存在的规则数量过多,难于理解和应用的问题,提出了一种基于闭项集的无冗余关联规则挖掘算法.首先,给出了无冗余关联规则的定义,并基于规则信任度的概念说明了该定义的合理性;其次,在生成子、闭项集和无冗余关联规则的基础上,给出了无冗余最小-最大精确规则基和无冗余最小-最大近似规则基的定义,并讨论了它们的剪枝策略.最后,讨论了生成子的性质及连接策略,并在包含索引的基础上,给出了一种宽度优先的无冗余关联规则挖掘算法.实验结果表明,本文提出的算法不仅可以发现规模较小的无冗余关联规则,提高了挖掘结果的可理解性,而且具有较高的挖掘效率.  相似文献   

3.
一种无冗余的关联规则发现算法   总被引:11,自引:0,他引:11  
关联规则是数据挖掘的重要研究内容之一,而传统算法生成的关联规则之间存在着大量的冗余规则。本文提出了一种通用的由量大频繁项目集生成无冗余关联规则的GNRR算法,利用规则之间的冗余关系,按一定顺序挖掘不同的规则,消除了规则之间的冗余性,使发现的规则数目呈指数倍减少。  相似文献   

4.
一种基于关联规则的缺省规则挖掘算法   总被引:2,自引:1,他引:2  
传统的基于Rough集的缺省规则挖掘算法须计算差别矩阵并生成大量的条件属性类,挖掘效率低.为此,本文引入相容关联规则和决策关联规则的概念,提出基于关联规则的缺省规则挖掘算法——DRMBAR,该算法借助FP-tree存储结构挖掘出决策关联规则,并用相容关联规则性质对决策关联规则进行有效修剪后生成相应的缺省规则,DRMBAR可有效地过滤噪声、提高缺省规则挖掘效率,且克服了传统算法依赖于主存的限制,为缺省规则的挖掘提供了一种新的框架。实验结果表明该算法是有效且可行的。  相似文献   

5.
由于在实际的数据挖掘过程中容易出现无用的频集和冗余的规则,所以降低频集和规则的冗余度可大大提高挖掘的质量,这也是数据挖掘中一直被关注的问题,提出了一个用等价类生成关联规则的方法,算法主要在频集的基础上建立项集的等价关系,进而对项集划分等价类,同时将得到的关联规则划分为精确关联规则和近似关联规则两个集合,通过等价类,不但可以很容易地生成所需要的关系规则,同时可以方便地判断数据之间依赖关系的强弱,同时,项集的等价关系在实际应用中也很有利用价值,算法最后的规则结果集剔除了由来自同一等价类中的面集的重复出现构成的冗余规则,从而得到了较小的关联规则集合。  相似文献   

6.
针对模糊属性事务数据库提取模糊关联规则的问题,采用模糊概念格与模糊关联规则相结合的方法,实现格节点与属性项集的对应关系,提出模糊关联规则格理论,在渐进式建格算法基础上对格节点相应修改,给出了适用于动态数据库的模糊关联规则格的构建思想.利用模糊关联规则格挖掘关联规则,与采用Apriori算法计算频繁项目集获取规则相比较,容易获得用户感兴趣的关联规则,同时减少冗余规则的生成,使挖掘算法得到优化.  相似文献   

7.
关联规则挖掘的AprioriTid算法的改进   总被引:1,自引:0,他引:1  
关联规则挖掘是数据挖掘中常见的一种形式。高效地找出频繁项目集是关联规则挖掘的中心问题.文章在分析生成频繁项目集的AprioriTid算法的基础上,指出了算法中存在由于项目的重复存储而使数据量偏大的问题,提出并证明了“Ck—l中支持率小于minsupport的项目集在Ck-1中是无用的”的定理。并以此为依据改进了算法.实验表明,改进算法在缩小数据规模方面是行之有效的.  相似文献   

8.
基于领域知识的冗余关联规则消除算法   总被引:1,自引:0,他引:1  
关联规则挖掘算法用于从大型数据库中提取感兴趣的规则,然而,在领域知识中已经能清晰表示的知识并没有被充分考虑,关联规则挖掘算法提取的规则中包含了大量已知的关联性,从而产生了很多冗余规则.文章提出一种算法DKARM,同时考虑了数据本身以及相关的领域知识,以消除在领域知识中清晰表示的已知关联性.实验表明,该算法合理消除了冗余规则,有效降低了规则数目.  相似文献   

9.
在关联规则挖掘中,大量的数据是多维的,且带有时态特性,所以往往需要在时态约束的前提下挖掘多维关联规则.本文从一个实际问题出发,在单维Apriori算法和已有的工作基础上,提出了一种新的多维时态关联规则挖掘算法,并与类似算法进行了比较.  相似文献   

10.
介绍了关联规则挖掘的研究情况,提出了基于聚类的周期关联规则挖掘算法,分析了该算法存在的问题并提出解决方案,展望了关联规则挖掘的未来研究方向.  相似文献   

11.
挖掘关联规则Apriori算法的一种改进   总被引:1,自引:0,他引:1  
本研究在对Apriori算法分析的基础上,提出了改进的Apriori算法。改进后的算法采用矩阵表示数据库,减少了扫描事物数据库的次数;利用向量运算来实现频繁项集的计数,同时及时地去掉不必要的数据,减少了数据运算,从而提高了算法的运行效率。  相似文献   

12.
针对常规关联规则定义中未涉及项域划分的问题, 提出极大关联规则是对常规关联规则的有益补充. 以软集理论和软集逻辑公式为主要工具, 解决了常规关联规则和极大关联规则挖掘中相关核心概念的描述问题, 获得了二者的统一数学刻画. 实例分析表明, 与经典挖掘方法相比, 基于软集逻辑公式的极大关联规则挖掘方法能有效降低冗余, 并剔除无效规则, 提高了所得规则的准确性和挖掘效率.  相似文献   

13.
基于量化概念格的关联规则挖掘   总被引:4,自引:0,他引:4  
在概念格的内涵中引入等价关系并将其外延量化 ,得到量化概念格。利用量化概念格可以清晰地表示知识 ,从而便于挖掘包括关联规则在内的多种规则 ,与经典的 A priori算法相比较 ,规则表示更简捷、直观 ,尤其重要的是用户可根据自己的兴趣交互地挖掘关联规则 ,不需要计算频繁项目集 ,因而提高了挖掘规则的效率 ,适用于大型数据库中关联规则的挖掘  相似文献   

14.
关联知识挖掘算法中一种广为人知的算法就是Aprior算法,之后所有关联规则挖掘算法的基本思想都是基于频繁项目集发现算法的基础上进行了改进.为了提高关联规则挖掘效率,首先回顾了基于图的关联规则挖掘算法;然后,在此基础上进行了改进,把关联规则挖掘中寻找频繁项集的问题转换为图中寻找完全子图的问题,通过在图中查找完全子图来寻找频繁项集.提出了一种基于图的关联规则挖掘改进算法,并且对原算法和改进的算法从时间和空间的性能进行了比较分析,得出改进的算法是有效可行的.最后从实验结果得出结论GenerateItemsets算法比DGBFIG算法优.  相似文献   

15.
Apriori算法是关联规则挖掘中最经典的算法,但它存在两大致命缺陷:需多次扫描数据库和产生海量的候选项目集。从这两个角度出发改进算法,提出了一种基于模式矩阵的高效改进算法(简称P-Matrix算法),使扫描数据库的次数减少为一次,同时不产生候选项目集而直接产生频繁项目集,从而使算法的时间复杂度和空间复杂度大大减少,有效地提高了Apriori算法的效率。  相似文献   

16.
针对传统的关联规则在试卷评估中应用出现的问题:由于试题的难易程度不同,被答对的概率也不一样,即数据集中数据项发生的概率不一样,数据项具有倾斜支持度分布的特征,选择合适的支持度阈值挖掘这样的数据集相当棘手。文章提出了基于试题难度系数加权的关联规则挖掘算法,从而解决因试题难度不同而导致数据项出现的概率不均的问题,发现更多有趣的关联规则,并且理论上证明了基于难度系数的加权关联规则算法保持频繁项集向下封闭的重要特性。  相似文献   

17.
基于关联规则的数据挖掘算法的时空耗费关键主要有两个:一个是需要对海量事务数据库进行多趟趋势,另一个是在JOIN运算中产生了大量潜在频繁项集。提出了利用堆栈模型动态生成频繁项集,每次用上次为产生新的频繁项集,边产生边判断,把满中最小信任度的频繁项集存放于链表中,减少了JOIN运算产生的多余项所占用的空间耗费。利用事务压缩法来减少事务库数据规模,对每次扫描后的事务数据库进行优化,从而达到减少空间耗费和扫描规模,提高效率的目的。  相似文献   

18.
关联规则挖掘主要用来发现数据库中存在的频繁项集.利用权值标识项目的重要程度,提出一种新的关联规则——加权关联规则的挖掘.由于项目权值的引入,Apriori性质不再成立,频繁项集的子集不再一定是频繁的.为此,提出k-最小支持数的概念,对原有Apriori算法进行改进.该算法能够挖掘出现频率小但是带来更大利润的项目,使得挖掘出的关联规则更加满足决策者的需求,也更加符合实际需要.  相似文献   

19.
一种高效关联规则挖掘算法   总被引:1,自引:0,他引:1  
为了提高关联规则挖掘算法处理数据库的效率,在研究AprioriTid算法的基础上提出一种高效的关联规则挖掘算法AprioriTidD,在计算数据库中的频繁项集时依靠有效的裁剪减少无效项集的产生,并且可减少产生候选项集,从而有效地提高算法的效率.选取程序模拟超市购物产生的3个试验数据集,应用AprioriTidD算法对该...  相似文献   

20.
传统的基于支持度—置信度框架的关联规则挖掘方法可能会产生大量不相关的、甚至是误导的关联规则,同时也不能区分正负关联规则。在充分考虑用户感兴趣模式的基础上,采用一阶谓词逻辑作为用户感兴趣的背景知识表示技术,提出了一种基于背景知识的包含正负项目集的频繁模式树,给出了针对正负项目集的约束频繁模式树的构造算法NCFP-Construct,从而提高了关联规则挖掘的效率和针对性,实验结果显示该方法是有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号