首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对含有决策信息的决策形式背景,提出了决策概念格模型,并定义决策概念格中的决策规则及规则的置信度和支持度,用户可根据实际的需求,从规则中提取满足最低置信度及支持度的规则.  相似文献   

2.
针对模糊属性事务数据库提取模糊关联规则的问题,采用模糊概念格与模糊关联规则相结合的方法,实现格节点与属性项集的对应关系,提出模糊关联规则格理论,在渐进式建格算法基础上对格节点相应修改,给出了适用于动态数据库的模糊关联规则格的构建思想.利用模糊关联规则格挖掘关联规则,与采用Apriori算法计算频繁项目集获取规则相比较,容易获得用户感兴趣的关联规则,同时减少冗余规则的生成,使挖掘算法得到优化.  相似文献   

3.
首先,通过对象诱导的三支条件近似概念格和三支决策近似概念格的细于关系,定义了不完备决策背景的OE-协调性;然后,在OE-协调的不完备决策背景上提出了对象诱导三支规则的提取方法, 分别从正面和负面的角度对规则进行获取和解释, 给出了冗余规则的判定定理及非冗余规则集的提取算法;最后,利用包含度理论,提出了带有置信度的三支规则提取方法, 提供了更为丰富的细节, 使得获取的规则更加完善。  相似文献   

4.
频繁项集挖掘是关联规则挖掘算法的核心,数据流的实时、无限及不可逆性给传统数据挖掘方法带来很大挑战.频繁闭项集挖掘为频繁项集挖掘提供了完整且低冗余的结果,是近年来数据流频繁项集挖掘研究的热点之一.介绍了数据流频繁闭项集挖掘的相关概念,并从搜索空间的遍历策略、误差结果控制方式等方面对数据流频繁闭项集挖掘算法进行了分析比较.  相似文献   

5.
频繁模式挖掘是数据挖掘研究中的关键问题之一,在关联规则等领域应用广泛.概念格是数据分析和知识表示的一种有效工具,适用于从数据库中挖掘规则的问题描述.分析了概念格在频繁模式挖掘的应用,包括对普通事务项集、序列项集及格、树和图等复杂结构的挖掘;讨论了概念格构造优化的必要性及两类主要的优化方法属性约简和剪枝概念格;并对关联规则提取的方法的优劣进行了基本比较,最后探讨了概念格未来的研究方向.  相似文献   

6.
更新挖掘最大频繁项目集是研究动态数据库挖掘的重要方面;文章在量化概念格的基础上,引进最小频繁概念格的概念,提出了一种快速的更新挖掘最大频繁项目集的算法,该算法能够在原有挖掘结果的基础上,快速有效地挖掘出更新后的数据库中隐含的新最大频繁项目集.  相似文献   

7.
针对海量数据的关联规则挖掘问题,提出了一种有效的基于等价类划分的并行频繁闭项集挖掘算法.该算法在MapReduce框架下,通过等价类的产生与划分、数据集的分配、异步频繁闭项集挖掘和汇总等步骤,不但较好地解决了多节点间的负载均衡问题,而且易于获得可靠的频繁闭项集.实验表明,该算法能有效克服传统算法挖掘效率低、冗余规则较多的缺点,整体上具有较高的性能.  相似文献   

8.
概念格通过概念的内涵和外延及泛化和例化之间的关系来表示知识,因而适用于从数据库中挖掘规则的问题描述;在概念格的内涵中引入等价关系并将其外延量化,得到量化概念格;利用量化概念格挖掘关联规则,与采用Apriori算法计算频繁项目集获取关联规则相比较,不需要计算频繁项目集,容易获得用户感兴趣的关联规则,同时减少了大量冗余的规则,提高了挖掘效率。  相似文献   

9.
形式概念分析是数据分析与知识发现的有效工具,现已被广泛应用于各个研究领域。决策形式背景是形式概念分析中的重要关系数据库之一,其主要研究内容是基于规则提取的知识发现。本文借助于Wille概念格和面向对象概念格对决策形式背景的规则提取问题进行研究,给出了规则提取算法,并通过高校就业数据对算法进行了实证分析。  相似文献   

10.
基于属性导出三支概念格的决策背景规则提取   总被引:1,自引:0,他引:1  
给出了决策形式背景在属性导出三支概念格下的规则提取方法。首先定义了属性导出的三支概念格间的细于关系,以此为基础给出了决策形式背景三支协调的定义以及在三支协调下提取规则的方法,并研究了所获规则与经典决策背景下所获规则的关系。最后结合实例阐明了三支规则的有效性与优越性。  相似文献   

11.
针对AE-概念格, 在属性三支协调下, 提出了保持非冗余规则信息不丢失的属性约简理论。 首先讨论了子背景下的相关性质, 其次定义了属性三支协调决策形式背景中的非冗余规则协调集, 并获得了该协调集的判定定理, 最后给出利用差别矩阵和差别函数得到相应约简的方法。  相似文献   

12.
发现频繁项集是关联规则挖掘的关键步骤。然而,大多数频繁项集求解算法因需要产生大量候选集而降低了效率。该文在研究概念格和频繁项集关系的基础上,将剪枝概念格PCL模型引入数据库中频繁项集的表示,利用概念间的关系性质,在不丢失信息的同时能有效压缩频繁项集的规模,并提出基于PCL模型的频繁项集求解算法。该算法基于Apriori性质,在构造过程中及时、动态地剪枝,删除与频繁项集求解无关的概念,从而有效地改善了频集挖掘算法的时空性能;实验证实了算法良好的性能。  相似文献   

13.
分布式数据库的精简频繁模式集及其挖掘算法   总被引:1,自引:0,他引:1  
对分布式数据库关联规则的挖掘与精简表示进行了研究,把频繁闭项集和最大频繁项集的概念推广到分布式数据库中,提出了在分布式环境下的频繁模式集的精简表示方法,以及一种基于各站点的全局大项目集的全局频繁闭项集和全局最大频繁项集的挖掘算法.该算法具有占用空间少、通信量小等特点.最后用实例进行了证明.  相似文献   

14.
关联规则挖掘的一种多剪枝概念格方法   总被引:1,自引:0,他引:1  
多数据源上关联规则挖掘方法,由于各数据节点间相互通信的候选项集数目过于庞大或者挖掘过程需要对数据库进行多次扫描,导致挖掘算法效率不高。研究剪枝概念格(pruned con-cept laffice,PCL)中概念与频繁项集表示关系,定义剪枝格上的导出频繁项集,设计了一个利用多剪枝概念格从多数据源上挖掘近似所有关联规则的算法UMPCL(union algorithm of multiplepruned concept lattice)。利用一个频繁概念表示一些频繁项集以减少挖掘过程中产生的侯选项集数,使用与全局支持度相等的局部支持度对各子概念格进行剪枝,最后融合、剪枝各子剪枝格并提取全局关联规则。理论分析和实验验证表明该算法是有效的。  相似文献   

15.
决策形式背景是在形式背景的基础上通过增加决策属性而得到的,相应的可生成条件格和决策格。基于这两个格中属性概念外延之间的关系提出属性粒协调决策形式背景这一概念,并从属性概念的角度给出决策形式背景现有的强协调性、弱协调性和协调性的新的描述方式,进一步解释属性粒协调决策形式背景与这三种决策形式背景之间的关系;最后,提出属性粒规则的概念,并给出以此为基础的规则获取方法。  相似文献   

16.
分析了概念格与关联规则之间的关系,提出了将频繁项集及其支持度存储在概念格上,然后在创建好的概念格上提取关联规则的方法,概念格的每个节点本质上是一个最大项目集,非常有利于关联规则的提取。为了充分利用概念格实现关联规则提取,提出了一种新的概念格结构:加权概念格,并给出其渐进式构造算法及基于该格结构上的关联规则提取算法。  相似文献   

17.
针对基于形式概念分析的关联规则提取侧重属性之间的正关联、忽略负关联的问题,提出一种基于三支概念分析的关联规则提取算法(3ARM)。利用对象导出三支概念的内涵包括表达"共同具有"语义的正属性子集和表达"共同不具有"语义的负属性子集的特点,结合三支概念格的泛化与例化结构,高效地提取正负关联规则;基于三支概念的闭项集特性,从三支概念格中选出包含频繁项集的候选概念进行挖掘,减少不必要的搜索;通过对三支概念之间的关系进行研究,从父子概念中提取无冗余的正关联规则和负关联规则,再从兄弟概念中提取正负规则对规则集进行补充,充分挖掘三支概念格中的知识。MovieLens数据集上的实验结果表明:应用3ARM算法,在最小支持度为10%时,得到正规则86 027条,负规则93 685条;3ARM算法得出的正规则数量比FARM算法的多出0.9倍~1.5倍,减少了FISM算法最多28.3%的冗余负规则,分别减少了FISM和FARM算法44%~63%和27%~62%的运行时间。  相似文献   

18.
在已有的基于概念格的关联规则挖掘算法中,搜索频繁结点的范围太大,从而导致花费大量的时间来产生关联规则.针对这一不足,利用"索引链表"数据结构来辅助快速地找到所有的频繁结点,缩小了结点的搜索范围,降低了概念格中挖掘关联规则算法的复杂度.  相似文献   

19.
基于量化概念格的关联规则挖掘   总被引:4,自引:0,他引:4  
在概念格的内涵中引入等价关系并将其外延量化 ,得到量化概念格。利用量化概念格可以清晰地表示知识 ,从而便于挖掘包括关联规则在内的多种规则 ,与经典的 A priori算法相比较 ,规则表示更简捷、直观 ,尤其重要的是用户可根据自己的兴趣交互地挖掘关联规则 ,不需要计算频繁项目集 ,因而提高了挖掘规则的效率 ,适用于大型数据库中关联规则的挖掘  相似文献   

20.
张长胜 《科学技术与工程》2013,13(23):6739-6745
提出一个数据流环境下的基于概念格和滑动窗口的频繁项集挖掘算法DSFMCL。算法在滑动窗口内分批挖掘新流入的基本窗口频繁概念后,生成概念格的Hasse图。引入最小支持度ζ和误差因子ε对非频繁概念节点进行剪枝操作。Hasse图中各节点包含频繁项集及其支持度信息。随着新基本窗口的Hasse图的生成与滑动窗口进行概念格纵向合并,最终通过对全部Hasse图节点的扫描可以输出所有频繁项集。实验结果表明,该算法具有良好的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号