首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
关联规则技术在数据挖掘中的应用   总被引:1,自引:0,他引:1  
数据挖掘技术的诞生,使我们能从大量的数据中提取对决策者有用的信息,20世纪90年代初,R.Agrawal等提出了关联规则挖掘技术.关联规则挖掘是为了发现大量数据中项目集之间感兴趣的相关性信息.经过十余年的发展,关联规则挖掘已经成为数据挖掘技术中较为成熟并很重要的一种方法.文中系统描述了关联规则挖掘所涉及的概念、关联规则挖掘算法和关联规则应用领域等.  相似文献   

2.
基于CMAR算法的水平加权多分类关联规则挖掘   总被引:1,自引:0,他引:1  
关联分类是数据挖掘中一种新的分类方法,它将关联规则挖掘和分类进行了算法集成.但在实际应用中,用户会比较倾向于自己最感兴趣或认为最重要的那部分属性,因此有必要加强这些属性对规则的影响,同时减弱另一些用户兴趣不大或认为不重要的属性对规则的影响.为此,本文提出了水平加权关联规则的问题,并结合CMAR算法,加以改进给出了关于该问题的解决方案及有效算法New_CMAR,实验表明,修改后的New_CMAR算法正确并符合实际,有实用价值.  相似文献   

3.
针对模糊属性事务数据库提取模糊关联规则的问题,采用模糊概念格与模糊关联规则相结合的方法,实现格节点与属性项集的对应关系,提出模糊关联规则格理论,在渐进式建格算法基础上对格节点相应修改,给出了适用于动态数据库的模糊关联规则格的构建思想.利用模糊关联规则格挖掘关联规则,与采用Apriori算法计算频繁项目集获取规则相比较,容易获得用户感兴趣的关联规则,同时减少冗余规则的生成,使挖掘算法得到优化.  相似文献   

4.
现有算法实现了事务内到事务间最大频繁项目集的转换,能够直接发现不同用户之间的关联关系.但在处理较大的事务数据库时,由于是在原数据库基础上进行关联分析,产生了大量的虚假规则.针对上述问题提出一种基于聚类分析的事务间关联规则挖掘算法,利用聚类分析将初始的复杂的数据集进行约简,去掉冗余数据,缩小数据集,避免了多次扫描数据库和...  相似文献   

5.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有意义的关联。随着大量数据不停的收集和存储,从数据库中挖掘关联规则显得越来越有必要性,关联规则挖掘的Apriori算法是数据库挖掘的最经典算法并得到广泛应用,在介绍关联规则挖掘和Apriori算法的基础上,发现Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。综述了Apriori算法的主要优化方法,并指出了Apriori算法在实际中的应用领域,提出了未来Apriori算法的研究方向和应用发展趋势。  相似文献   

6.
关联规则是数据挖掘领域的一个重要分支,而发现频繁项目集是关联规则数据挖掘中的关键问题.频繁项目集是在给定的交易数据库D下满足最小支持度和最小置信度下的一个项目集合,但随着数据集的增减,就会产生不同的频繁项目集.如何发现在数据集变化情况下频繁项目集快速和高效地更新是文中解决的问题.为此提出了一种改进的增量更新算法,实验结果表明此算法有较好的效果.  相似文献   

7.
概念格通过概念的内涵和外延及泛化和例化之间的关系来表示知识,因而适用于从数据库中挖掘规则的问题描述;在概念格的内涵中引入等价关系并将其外延量化,得到量化概念格;利用量化概念格挖掘关联规则,与采用Apriori算法计算频繁项目集获取关联规则相比较,不需要计算频繁项目集,容易获得用户感兴趣的关联规则,同时减少了大量冗余的规则,提高了挖掘效率。  相似文献   

8.
 关联规则挖掘能使我们发现数据库中大量项目与项目之间的相关关系,但是用传统关联规则生成方法所生成的规则一是数量庞大,二是其中包含许多具有相同意义的规则,这必然对用户理解和提取信息带来干扰.通过求封闭项目集大大消减了频繁项目集数量,再由封闭项目集构造一种新的存储机制——-近似格,基于近似格可以得到冗余度较小的关联规则,从而提供用户简洁紧凑又无信息丢失的关联规则集.  相似文献   

9.
针对使用传统关联规则算法挖掘大数据集时,挖掘过程中效率不高,挖掘出大量冗余规则的问题,提出了基于关联规则和相似度的数据挖掘算法(U-APR):首先,一次性读入数据并构建矩阵,并利用关联规则支持度度量的特性来增加判断属性,以加快结束迭代过程,从而改进了Apriori算法频繁扫描数据库问题;然后,使用相似度算法去除冗余的关联规则;最后,结合置信度、支持度和用户目标匹配度对挖掘结果进行排序输出,从而得到用户感兴趣的关联规则. 同时,应用该算法与目前常用的2种关联规则算法对广东某高校学生财务数据进行数据挖掘. 实验结果表明:与2种常用的关联规则算法相比,U-APR算法缩短了运算时间和提高了存储空间利用率,对用户分析挖掘结果有较好的优化效果.  相似文献   

10.
张争龙 《科学技术与工程》2013,13(19):5687-5691
针对实际交易数据库中,不同项目的重要性和出现概率各不相同的两个问题,提出一种基于等价类和多最小支持度的加权关联规则算法,从而挖掘出那些覆盖较少数据但却有意义、用户可能更感兴趣的关联规则。算法按照项目的最小支持度升序对交易记录进行等价类划分,然后按照项目的最小支持度降序依次求出每一等价类内的加权频繁项集。算法采用垂直数据库的数据表示形式,挖掘过程中避免了对数据库的重复扫描。对比实验结果证明,改进算法具有良好的挖掘性能。  相似文献   

11.
典型的关联规则仅考虑事务中所列举的项目,这样的规则主要是正关联规则.负关联规则不但要考虑事务中所包含的项目集,还要考虑事务中所不包含的项目,它有利于进行购物篮分析以发现那些相关的商品或互斥的商品.而已有的负关联规则挖掘的算法具有很大的局限性.为此,文中提出了一种基于位矩阵的负关联规则挖掘新算法.通过算例表明,该算法是有效可行的.  相似文献   

12.
Typical association rules consider only items enumerated in transactions. Such rules are referred to as positive association rules. Negative association rules also consider the same items, but in addition consider negated items (i. e. absent from transactions). Negative association rules are useful in market-basket analysis to identify products that conflict with each other or products that complement each other. They are also very convenient for associative classifiers, classifiers that build their classification model based on association rules. Indeed, mining for such rules necessitates the examination of an exponentially large search space. Despite their usefulness, very few algorithms to mine them have been proposed to date. In this paper, an algorithm based on FP tree is presented to discover negative association rules.  相似文献   

13.
关联规则挖掘是数据挖掘研究的一个重要领域,传统的关联规则仅反映了正项之间的关联关系,无法反映出数据之间隐藏的负关联关系.从以下方面对含负项的关联规则挖掘进行了综述:引入负项的原因,包含正、负项的关联规则概念及相关术语,最新的含负项关联规则研究情况,经典算法的讨论.最后,展望了含负项关联规则领域未来的研究方向.  相似文献   

14.
基于蚂蚁的进化算法已经被广泛地应用于各种组合优化问题。首次结合蚁群算法提出了关联规则的蚁群挖掘算法(RA3)。利用数据集中属性和属性值对应超顶点和子顶点而构成无向图。蚂蚁对在无向图中不断地分别搜索挖掘频繁项集合,从而构成双规则前件、后件,并根据规则质量对双规则加以取舍。提出的算法可以在标准测试集中有效地实现关联规则的提取。与经典的Apriori和FP-growth算法比较,模拟实验证明,本文算法可以较快的挖掘出关联规则,具有较好的规则质量。  相似文献   

15.
关联规则的挖掘是一个重要的数据挖掘问题,在关联规则的挖掘过程中加入约束条件,是实现用户参与挖掘的一种方式,这样得到的规则是用户所真正关心的,而Separate算法便是这类算法的代表.先对Separate算法进行了改进,从而进一步提高其性能,然后用改进后的算法挖掘实际应用中的一个实例,最后对挖掘结果给出相关决策解释.  相似文献   

16.
关联规则挖掘是数据挖掘的一个重要方面。本文介绍了在大型事务数据库中采掘关联规则的常用算法,并对它们的性能进行了比较和分析。  相似文献   

17.
很多时候一个事务记录中所包含的信息除了项目以外,还包括与这些项目相关的数值信息,这些数值信息同样可以作为关联规则的一种约束而存在,基于上述问题,文中提出了一个基于模糊数值约束的关联规则挖掘方法,实验结果表明该方法具有较好的伸缩性。  相似文献   

18.
常见关联规则算法分析与比较   总被引:2,自引:0,他引:2  
介绍了常见的10种关联规则算法:AIS算法、SETM算法、A州州算法等,并对各种算法的性能进行了分析比较.其中SETM算法效率最低,但和DBMS集成的最好,AVM算法效率最高,但只适用于布尔类型的关联规则.  相似文献   

19.
hldirect association is a high level relationship between items and frequent itemsets in data. Current research approaches on indirect association mining are limited to indirect association between itempairs,which will discover too many rules from dataset. A formal definition of indirect association between multiple items is presented, along with an algorithm, SET NIA, for mining this kind of indirect associations based on anti-monotonicity of indirect associations and frequent itempair support matrix. While the found rules contain same information as compared to the rules found by indirect association between itempairs algorithms, this notion brings space-saving in storage of the rules as well as superiority for human to understand and apply the ndes. Experiments conducted on two real-word datasets show that SET _ NIA can effectively find fewer rules than existing algorithms which mine indirect association between itempairs,the experimental results also prove that SET_NIA has better performance than existing algorithms.  相似文献   

20.
关联规则Apriori算法的改进   总被引:7,自引:0,他引:7  
Apriori算法是关联规则提取的经典算法,但存在一些不足之处。关联算法的研究主要集中在提高Apriori算法的效率上。本文分析了该算法并进行了改进,使得频繁集产生的同时精简事务集。这种算法及时去掉了不必要的数据,减少了数据运算,从而使算法更优化。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号