首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 453 毫秒
1.
传统的关联规则挖掘数据的方法虽然取得了很好的成效,但是其中还存在算法效率、规则的后期处理等等一系列的问题,为解决这些问题,对传统的关联规则挖掘进行优化,提出了挖掘支配关联规则.  相似文献   

2.
在属性的高层概念上发现的关联规则为高层关联规则,对基于对象立方体结构的高层关联规则挖掘方法进行了研究.提出了一种挖掘高层关联规则的算法,并用算法进行了实验,得到的关联规则可以为用户提供一些常识性的知识,对高层决策有较大的帮助.  相似文献   

3.
讨论了对分类规则的挖掘采用基于关联的分类方法.关联分类规则挖掘方法主要包括两大处理步骤:第一步利用分类关联规则挖掘算法挖掘出有关的分类关联规则;第二步就是基于所挖掘出的分类关联规则构造一个分类器.详细介绍了该方法的实现算法和部分数据结构.  相似文献   

4.
关联规则挖掘在苯酐生产中的应用   总被引:2,自引:0,他引:2  
简单介绍了数据挖掘中的关联规则挖掘技术 ,用关联规则方法分析了影响苯酐生产的 3个关键属性 ,找到了它们之间的关系。实验证明 ,关联规则挖掘十分适用于过程工业中的优化问题分析。  相似文献   

5.
对关联规则挖掘问题建立了完全格描述并给出了问题规模下限,提出了一种基于搜索空间划分的项集频度计算模型.在对FP-树进行改造的基础上提出基于划分思想的频繁项集挖掘算法UPM,算法的项集频度计算和非频繁项目裁剪都基于空间划分的思想.性能实验表明,与FP-Growth算法相比,UPM算法的时空效率有较大提高.  相似文献   

6.
针对使用传统关联规则算法挖掘大数据集时,挖掘过程中效率不高,挖掘出大量冗余规则的问题,提出了基于关联规则和相似度的数据挖掘算法(U-APR):首先,一次性读入数据并构建矩阵,并利用关联规则支持度度量的特性来增加判断属性,以加快结束迭代过程,从而改进了Apriori算法频繁扫描数据库问题;然后,使用相似度算法去除冗余的关联规则;最后,结合置信度、支持度和用户目标匹配度对挖掘结果进行排序输出,从而得到用户感兴趣的关联规则. 同时,应用该算法与目前常用的2种关联规则算法对广东某高校学生财务数据进行数据挖掘. 实验结果表明:与2种常用的关联规则算法相比,U-APR算法缩短了运算时间和提高了存储空间利用率,对用户分析挖掘结果有较好的优化效果.  相似文献   

7.
针对模糊属性事务数据库提取模糊关联规则的问题,采用模糊概念格与模糊关联规则相结合的方法,实现格节点与属性项集的对应关系,提出模糊关联规则格理论,在渐进式建格算法基础上对格节点相应修改,给出了适用于动态数据库的模糊关联规则格的构建思想.利用模糊关联规则格挖掘关联规则,与采用Apriori算法计算频繁项目集获取规则相比较,容易获得用户感兴趣的关联规则,同时减少冗余规则的生成,使挖掘算法得到优化.  相似文献   

8.
一种基于关联规则的缺省规则挖掘算法   总被引:2,自引:1,他引:2  
传统的基于Rough集的缺省规则挖掘算法须计算差别矩阵并生成大量的条件属性类,挖掘效率低.为此,本文引入相容关联规则和决策关联规则的概念,提出基于关联规则的缺省规则挖掘算法——DRMBAR,该算法借助FP-tree存储结构挖掘出决策关联规则,并用相容关联规则性质对决策关联规则进行有效修剪后生成相应的缺省规则,DRMBAR可有效地过滤噪声、提高缺省规则挖掘效率,且克服了传统算法依赖于主存的限制,为缺省规则的挖掘提供了一种新的框架。实验结果表明该算法是有效且可行的。  相似文献   

9.
利用模糊集理论, 结合数据库模糊查询、 规则模板及语言量词等概念和方法, 通过数值信息对规则做进一步约束, 解决了关联规则挖掘中未考虑与项目相关数值信息的缺陷, 提出了基于模糊数值约束的关联规则挖掘, 实验结果表明, 所提出的挖掘方法具有良好的伸缩性, 挖掘效果更具有针对性.  相似文献   

10.
频繁模式挖掘是数据挖掘研究中的关键问题之一,在关联规则等领域应用广泛.概念格是数据分析和知识表示的一种有效工具,适用于从数据库中挖掘规则的问题描述.分析了概念格在频繁模式挖掘的应用,包括对普通事务项集、序列项集及格、树和图等复杂结构的挖掘;讨论了概念格构造优化的必要性及两类主要的优化方法属性约简和剪枝概念格;并对关联规则提取的方法的优劣进行了基本比较,最后探讨了概念格未来的研究方向.  相似文献   

11.
基于相似性的关联规则启发式发现   总被引:3,自引:0,他引:3  
找出众多关联规则中用户感兴趣的关联规则,除靠最小支持度和最小可信度外,把相似性计算融合到通过剪枝选出用户感兴趣规则的模板理论中.提出一种基于相似性的关联规则启发式发现方法.该方法有效地解决了模板理论中的由于描述模糊而导致的不合理剪枝的问题.  相似文献   

12.
对经典算法ML—T2的剪枝策略进行了详细的研究,并针对其剪枝过程中存在的问题提出一种改进型的多级关联规则算法IML。  相似文献   

13.
基于约束的关联规则挖掘是针对特定约束的规则的挖掘,挖掘的结果有着更好的针对性和实用性,Separate算法是现有的效果较好的算法,但有2点不足:未修剪生成的候选集和候选项重复生成。对此该文提出了改进的SeparateP算法,算法中加入了对候选集的修剪,并且利用了项集重复生成的信息,使候选集的修剪更加有效快捷。实验表明,改进算法显著提高了原算法的效率。  相似文献   

14.
提出一种从大型数据库中挖掘关联规则的快速算法——自适应快速关联规则提取算法。该算法以经典的Apriori算法及其他各种优化算法为基础,引入了自适应步长和扫描树的概念,并采用修剪法对Apriori算法进行了改进。理论分析与实验结果表明,该算法比Apriori算法的应用效率高,同时也证实了其有效性。  相似文献   

15.
关联规则挖掘的一种多剪枝概念格方法   总被引:1,自引:0,他引:1  
多数据源上关联规则挖掘方法,由于各数据节点间相互通信的候选项集数目过于庞大或者挖掘过程需要对数据库进行多次扫描,导致挖掘算法效率不高。研究剪枝概念格(pruned con-cept laffice,PCL)中概念与频繁项集表示关系,定义剪枝格上的导出频繁项集,设计了一个利用多剪枝概念格从多数据源上挖掘近似所有关联规则的算法UMPCL(union algorithm of multiplepruned concept lattice)。利用一个频繁概念表示一些频繁项集以减少挖掘过程中产生的侯选项集数,使用与全局支持度相等的局部支持度对各子概念格进行剪枝,最后融合、剪枝各子剪枝格并提取全局关联规则。理论分析和实验验证表明该算法是有效的。  相似文献   

16.
ntroductionInrecentyearsdatamining,orknowledgediscoveryindatabases(KDD),hasatractedalotofinterestinboththedatabaseandthecompu...  相似文献   

17.
频繁项集的挖掘效率是关联规则产生的关键.针对经典Apriori算法的瓶颈,提出一种改进算法,通过数组结构来保存项集信息,只须扫描一遍数据库减少了时间开销.在自连接前进行项目计数,减少参加连接的项集数量,减少了候选项集的数量.通过实例证明,改进算法的效率更高.  相似文献   

18.
现有的关联规则更新算法大多致力于解决增量更新本身,但很少同时考虑更新时机,不适于对实时应用中频繁更新的数据进行有效处理.针对此问题,提出了一种与时机判定相结合的关联规则增量更新算法,在改进增量更新方法的同时,兼顾对更新时机的判定.在关联规则增量更新阶段,计算含有非空子集个数之和最多的频繁项集,找出在更新数据集中仍然频繁的项集,根据Apriori性质,避免对其子集的处理,从而实现对候选项集的有效剪枝.实验结果表明,该算法通过对更新时机的及时判定和候选项集的有效剪枝,提高了关联规则的更新效率.  相似文献   

19.
在AFS(axiomatic fuzzy set)理论框架下,提出了一种基于模糊概念相似性与模糊熵度量的分类算法.模糊分类规则的前件通过概念聚合得到,一种基于模糊概念相似性与模糊熵度量的概念选择函数指导聚合过程;然后,利用剪枝算法对得到的模糊规则集进行剪枝,得到最终的分类规则集.用8组来自UCI数据库的数据集作为实验数据对算法进行验证,并与7种经典分类方法进行比较.实验结果表明该算法能得到较高的分类精度,分类结果明显优于参照的分类方法.  相似文献   

20.
基于有向图的关联规则算法   总被引:5,自引:0,他引:5  
提出了一种基于有向图的关联规则挖掘算法,采用了垂直二进制位图映射数据库,根据垂直二进制位图来生成有向图,将频繁项的二进制位串作为有向图的权值,通过分析有向图生成最大频繁项集,并给出了最大频繁项集挖掘算法的优势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号