首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 203 毫秒
1.
针对关联分类规则产生的候选规则过多导致效率不高的问题,提出一种基于频繁闭项集组成的扩展概念格的分类规则获取方法.利用频繁闭项集提出一种新的概念格模型,通过性质和定理对概念格结点进行剪枝,以抽取分类尽量少且最有效的关联分类规则.研究结果表明:该算法能挖掘出高质量且包含重要信息的关联分类规则,并大大减少关联分类规则的数量,在分类准确率上比现有的关联分类典型算法更高.  相似文献   

2.
发现频繁项集是关联规则挖掘的关键步骤。然而,大多数频繁项集求解算法因需要产生大量候选集而降低了效率。该文在研究概念格和频繁项集关系的基础上,将剪枝概念格PCL模型引入数据库中频繁项集的表示,利用概念间的关系性质,在不丢失信息的同时能有效压缩频繁项集的规模,并提出基于PCL模型的频繁项集求解算法。该算法基于Apriori性质,在构造过程中及时、动态地剪枝,删除与频繁项集求解无关的概念,从而有效地改善了频集挖掘算法的时空性能;实验证实了算法良好的性能。  相似文献   

3.
采用剪枝方法,通过对NextClosure算法的改进,提出一种基于剪枝的概念格批处理算法Prun-NextClosure,减少了概念格构造过程中闭包运算的次数,从而提高概念格的构造效率。实验使用随机生成的数据集,验证了该算法的正确性和有效性。  相似文献   

4.
为解决概念格挖掘优化问题,借鉴变精度粗糙集模型和协同进化思想,提出了融合变精度粗糙熵和全局粒子群的概念格协同挖掘算法(REVPT).该算法引入变精度粗糙熵对各概念格子群动态度量建立粗糙近似格,并通过种群之间协作共享寻优经验提高概念格的全局挖掘优化能力,有效缩减原格群规模并挖掘出一致粗糙分类规则.实验结果表明,当变精度粗...  相似文献   

5.
关联规则挖掘的一种多剪枝概念格方法   总被引:1,自引:0,他引:1  
多数据源上关联规则挖掘方法,由于各数据节点间相互通信的候选项集数目过于庞大或者挖掘过程需要对数据库进行多次扫描,导致挖掘算法效率不高。研究剪枝概念格(pruned con-cept laffice,PCL)中概念与频繁项集表示关系,定义剪枝格上的导出频繁项集,设计了一个利用多剪枝概念格从多数据源上挖掘近似所有关联规则的算法UMPCL(union algorithm of multiplepruned concept lattice)。利用一个频繁概念表示一些频繁项集以减少挖掘过程中产生的侯选项集数,使用与全局支持度相等的局部支持度对各子概念格进行剪枝,最后融合、剪枝各子剪枝格并提取全局关联规则。理论分析和实验验证表明该算法是有效的。  相似文献   

6.
加权概念格是针对属性的重要程度,通过引入内涵权值而形成的一种格结构。采用加权概念格作为分类规则提取工具,通过引入加权外延支持度,给出了一种新的分类规则的提取算法CRAAF-WCL。最后,利用恒星光谱数据作为形式背景,实验验证了该算法具有较高的分类效果。  相似文献   

7.
概念格及其应用进展   总被引:60,自引:0,他引:60  
概念格是近年来获得飞速发展的数据分析的有力工具。从数据集中生成概念格的过程实质上是一种概念聚类过程。然而 ,概念格可以用于许多机器学习的任务 ,例如分类 ,关联规则的挖掘等。论文介绍了概念格的基本概念 ,讨论了现有的几种建格算法和在格上提取规则的方法及相关系统和应用。另外 ,还介绍了格的剪枝及概念格和另一个新型数据分析工具粗糙集之间的关系。  相似文献   

8.
张长胜 《科学技术与工程》2013,13(23):6739-6745
提出一个数据流环境下的基于概念格和滑动窗口的频繁项集挖掘算法DSFMCL。算法在滑动窗口内分批挖掘新流入的基本窗口频繁概念后,生成概念格的Hasse图。引入最小支持度ζ和误差因子ε对非频繁概念节点进行剪枝操作。Hasse图中各节点包含频繁项集及其支持度信息。随着新基本窗口的Hasse图的生成与滑动窗口进行概念格纵向合并,最终通过对全部Hasse图节点的扫描可以输出所有频繁项集。实验结果表明,该算法具有良好的性能。  相似文献   

9.
提出了Fccrm算法.它采用划分的方法降低了形式背景的规模,通过求形式概念中的最大概念以及它们的下覆盖获取到全部的概念节点,避免了概念格中的复杂关系.同时,该算法还采用了概念剪枝的方法,降低了形式概念集的规模.分类规则集则从形式概念集中提取得到.实验结果表明该算法在性能上有了很大的改进,而且通过形式概念集获取的规则集对于样本集是完备的.  相似文献   

10.
在AFS(axiomatic fuzzy set)理论框架下,提出了一种基于模糊概念相似性与模糊熵度量的分类算法.模糊分类规则的前件通过概念聚合得到,一种基于模糊概念相似性与模糊熵度量的概念选择函数指导聚合过程;然后,利用剪枝算法对得到的模糊规则集进行剪枝,得到最终的分类规则集.用8组来自UCI数据库的数据集作为实验数据对算法进行验证,并与7种经典分类方法进行比较.实验结果表明该算法能得到较高的分类精度,分类结果明显优于参照的分类方法.  相似文献   

11.
分类是数据挖掘中的一个重要问题.概念格通过概念的内涵和外延及泛化和例化之间的关系来表示知识,因而适用于从数据库中挖掘规则的问题描述.在量化的相对约简格基础上,提出一种新的分类规则发现算法,该算法的生成结果剔除了冗余的分类规则,算法在时间性能、空间性能等方面均有较大的提高.  相似文献   

12.
一种基于粗集理论的概念格构造方法   总被引:1,自引:0,他引:1  
概念格是数据分析与规则提取的一种有效工具,但是在实际应用中由于需要处理的数据是海量的,使得直接基于概念格上提取规则的冗余度过大,造成机器计算时间和空间的浪费,而粗集理论在数据预处理和不确定性规则提取等方面表现出很强的优势,因此,为了减少人力物力的浪费,本文提出了一种应用粗集理论构造概念格的算法,且指出了该算法的优点及存在的不足。  相似文献   

13.
提出了一种基于Routh有限概念格的规则发现方法(RRLIRD),以揭示数据集中的蕴涵规则。首先引入有限概念格的简化表示形式,由用户选择数据集中感兴趣属性集创建概念格结构,提高用户的交互性和挖掘的效率;然后运用有限概念格与Rough集理论相结合形成Rough有限概念格,蕴涵规则则由其特有的上、下近似运算得到,不需计算繁琐的频繁项目集。算法运用大型超市的交易流水数据进行仿真实验。结果表明,执行时间比经典的Apriori算法大大降低。该算法也适用于证券行情分析和农业数据库的病虫害分析等。  相似文献   

14.
概念格通过概念的内涵和外延及泛化和例化之间的关系来表示知识,因而适用于从数据库中挖掘规则的问题描述;在概念格的内涵中引入等价关系并将其外延量化,得到量化概念格;利用量化概念格挖掘关联规则,与采用Apriori算法计算频繁项目集获取关联规则相比较,不需要计算频繁项目集,容易获得用户感兴趣的关联规则,同时减少了大量冗余的规则,提高了挖掘效率。  相似文献   

15.
首先,通过对象诱导的三支条件近似概念格和三支决策近似概念格的细于关系,定义了不完备决策背景的OE-协调性;然后,在OE-协调的不完备决策背景上提出了对象诱导三支规则的提取方法, 分别从正面和负面的角度对规则进行获取和解释, 给出了冗余规则的判定定理及非冗余规则集的提取算法;最后,利用包含度理论,提出了带有置信度的三支规则提取方法, 提供了更为丰富的细节, 使得获取的规则更加完善。  相似文献   

16.
基于量化概念格的关联规则挖掘   总被引:4,自引:0,他引:4  
在概念格的内涵中引入等价关系并将其外延量化 ,得到量化概念格。利用量化概念格可以清晰地表示知识 ,从而便于挖掘包括关联规则在内的多种规则 ,与经典的 A priori算法相比较 ,规则表示更简捷、直观 ,尤其重要的是用户可根据自己的兴趣交互地挖掘关联规则 ,不需要计算频繁项目集 ,因而提高了挖掘规则的效率 ,适用于大型数据库中关联规则的挖掘  相似文献   

17.
为改进数据分类的效果,基于粗糙集理论实现数据分类和规则推理的基本原理,利用粗糙集理论中核及决策类覆盖的思想,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系,简化带有不相容规则的决策系统的数据挖掘算法。通过PL/SQL演示了挖掘分类规则的过程,结果表明基于粗糙集分类算法的有效性。  相似文献   

18.
概念格递增修正关联规则挖掘方法   总被引:1,自引:0,他引:1  
研究了一种知识发现与数据挖掘中关联规则的发现方法 .关联规则是数据挖掘的重要方法之一 ,其核心是各大项目集的获取 .针对货篮关联规则挖掘方法 ,提出了一种改进的概念格递增修正方法 .该方法适应于数据库的动态数据递增或递减更新 ,通过记录项目集 (即概念格中的结点 )在数据库中出现的频率值 ,不需要构造完整的格即可求得项目集的支持度值和可信度值 ,以获取大项目集 ,进而求得关联规则 .同时 ,该方法运用 Hasse图解进行可视化操作 ,降低了算法的时间复杂度  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号