首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
概念格通过概念的内涵和外延及泛化和例化之间的关系来表示知识,因而适用于从数据库中挖掘规则的问题描述;在概念格的内涵中引入等价关系并将其外延量化,得到量化概念格;利用量化概念格挖掘关联规则,与采用Apriori算法计算频繁项目集获取关联规则相比较,不需要计算频繁项目集,容易获得用户感兴趣的关联规则,同时减少了大量冗余的规则,提高了挖掘效率。  相似文献   

2.
提出一种有效的基于概念格的分布式挖掘算法,重点讨论由部分量化规则格提取的部分关联规则的合并技术,由于能对已存在关联规则的再利用,从而更有利于用概念格来挖掘关联规则.该算法根据对局部关联规则挖掘结果的分布式合成,有利于减轻网络频繁的通讯负担,体现并行计算、异步异构数据挖掘的优点.  相似文献   

3.
频繁模式挖掘是数据挖掘研究中的关键问题之一,在关联规则等领域应用广泛.概念格是数据分析和知识表示的一种有效工具,适用于从数据库中挖掘规则的问题描述.分析了概念格在频繁模式挖掘的应用,包括对普通事务项集、序列项集及格、树和图等复杂结构的挖掘;讨论了概念格构造优化的必要性及两类主要的优化方法属性约简和剪枝概念格;并对关联规则提取的方法的优劣进行了基本比较,最后探讨了概念格未来的研究方向.  相似文献   

4.
关联规则挖掘的一种多剪枝概念格方法   总被引:1,自引:0,他引:1  
多数据源上关联规则挖掘方法,由于各数据节点间相互通信的候选项集数目过于庞大或者挖掘过程需要对数据库进行多次扫描,导致挖掘算法效率不高。研究剪枝概念格(pruned con-cept laffice,PCL)中概念与频繁项集表示关系,定义剪枝格上的导出频繁项集,设计了一个利用多剪枝概念格从多数据源上挖掘近似所有关联规则的算法UMPCL(union algorithm of multiplepruned concept lattice)。利用一个频繁概念表示一些频繁项集以减少挖掘过程中产生的侯选项集数,使用与全局支持度相等的局部支持度对各子概念格进行剪枝,最后融合、剪枝各子剪枝格并提取全局关联规则。理论分析和实验验证表明该算法是有效的。  相似文献   

5.
基于模糊概念格构建的汽车评价知识库可以通过概念及格结构刻画知识与知识间的层次关系。若从汽车评价数据中挖掘关联知识将对汽车性能推理具有非常重要的作用。文章运用模糊关联规则格的方法对基于模糊概念格表示的知识库进行改进。为了提高模糊关联规则提取的性能,将部分参数进行重新定义,用于构建汽车评价的关联知识,以补充和完善模糊概念格表示的知识。在此基础上,依据模糊关联规则对汽车缺省的评价信息进行推理。  相似文献   

6.
在已有的基于概念格的关联规则挖掘算法中,搜索频繁结点的范围太大,从而导致花费大量的时间来产生关联规则.针对这一不足,利用"索引链表"数据结构来辅助快速地找到所有的频繁结点,缩小了结点的搜索范围,降低了概念格中挖掘关联规则算法的复杂度.  相似文献   

7.
在已有的基于概念格的关联规则挖掘算法中,搜索频繁结点的范围太大,从而导致花费大量的时间来产生关联规则。针对这一不足,利用“索引链表”数据结构来辅助快速地找到所有的频繁结点,缩小了结点的搜索范围,降低了概念格中挖掘关联规则算法的复杂度。  相似文献   

8.
针对模糊属性事务数据库提取模糊关联规则的问题,采用模糊概念格与模糊关联规则相结合的方法,实现格节点与属性项集的对应关系,提出模糊关联规则格理论,在渐进式建格算法基础上对格节点相应修改,给出了适用于动态数据库的模糊关联规则格的构建思想.利用模糊关联规则格挖掘关联规则,与采用Apriori算法计算频繁项目集获取规则相比较,容易获得用户感兴趣的关联规则,同时减少冗余规则的生成,使挖掘算法得到优化.  相似文献   

9.
分类是数据挖掘中的一个重要问题.概念格通过概念的内涵和外延及泛化和例化之间的关系来表示知识,因而适用于从数据库中挖掘规则的问题描述.在量化的相对约简格基础上,提出一种新的分类规则发现算法,该算法的生成结果剔除了冗余的分类规则,算法在时间性能、空间性能等方面均有较大的提高.  相似文献   

10.
针对基于形式概念分析的关联规则提取侧重属性之间的正关联、忽略负关联的问题,提出一种基于三支概念分析的关联规则提取算法(3ARM)。利用对象导出三支概念的内涵包括表达"共同具有"语义的正属性子集和表达"共同不具有"语义的负属性子集的特点,结合三支概念格的泛化与例化结构,高效地提取正负关联规则;基于三支概念的闭项集特性,从三支概念格中选出包含频繁项集的候选概念进行挖掘,减少不必要的搜索;通过对三支概念之间的关系进行研究,从父子概念中提取无冗余的正关联规则和负关联规则,再从兄弟概念中提取正负规则对规则集进行补充,充分挖掘三支概念格中的知识。MovieLens数据集上的实验结果表明:应用3ARM算法,在最小支持度为10%时,得到正规则86 027条,负规则93 685条;3ARM算法得出的正规则数量比FARM算法的多出0.9倍~1.5倍,减少了FISM算法最多28.3%的冗余负规则,分别减少了FISM和FARM算法44%~63%和27%~62%的运行时间。  相似文献   

11.
提出一种基于AprTidRec算法的分布武关联规则挖掘算法,并通过实验验证了算法运行的有效性。给出基于局部一全局通信模式的分布式关联规则挖掘方案,并在此方案基础之上进行了系统实现。  相似文献   

12.
快速关联规则挖掘算法   总被引:1,自引:0,他引:1  
刘景春 《佳木斯大学学报》2004,22(2):151-156,177
提出了一种新颖的关联规则挖掘算法QAIS,与经典两阶段式关联规则挖掘算法不同的是,它只需扫描一遍事务数据库,不需要生成候选集,并且可以方便的应用在增量式关联规则挖掘算法中,该算法经合成数据验证是有效的.同时针对关联规则生成过程中出现大量冗余规则的问题,还讨论了冗余关联规则去除的问题.  相似文献   

13.
通过给定的最小支持率和最小信任度来挖掘语言值关联规则往往会得到很多规则,因此用户很难获得真正关注的语言值关联规则.本文提出一种挖掘典型语言值关联规则的算法,此算法将挖掘得到的语言值关联规则按照相同的后件进行分组,然后对每个分组中的语言值关联规则根据规则之间的不相似性进行聚类.最后从每个类中挑选出代表类原型的语言值关联规则作为典型的语言值关联规则.典型的语言值关联规则是语言值关联规则集合中最具有代表意义的规则.  相似文献   

14.
关联规则挖掘在旅游突发事件预测中的研究   总被引:1,自引:0,他引:1  
基于数据挖掘中的关联规则挖掘及Apriori算法,研究了在旅游行业中用挖掘得到的规则对突发事件进行预测的方法.对突发事件进行了预处理,对与突发事件相关的规则进行了挖掘,提出了改进的关联规则算法,并获得了有意义的规则输出,并对这些关联规则在旅游业的应用进行了研究.  相似文献   

15.
一种关系数据库中基于云模型关联规则的提取   总被引:2,自引:1,他引:2  
为了发现有效的关联规则,属性在比较高的水平被范化,允许相邻属性值或者语言项的重量.这种软划分可以映射人类的想法,同时使发现的知识鲁棒.利用云模型的理论与方法求解数量关联问题,给出了一种云关联规则的定义,并提出了基于云模型理论支持度和置信度的计算方法,最后提出了一种提取算法Cloud model A.这种方法较好地软化了数量属性论域的划分边界,从而使得挖掘出的云关联规则更容易被人理解。  相似文献   

16.
一种高效并行关联规则挖掘新算法   总被引:1,自引:0,他引:1  
提出了一种在微机集群上实现的高效并行算法。该算法利用矩阵理论中上三角矩阵的良好性质,通过数据库约简、投影等操作,在微机集群的各节点上开展并行挖掘,从而提高挖掘算法的效率和可扩性。在微机集群上的实验证明,该算法能大大提高关联规则的挖掘效率,并具有良好的可扩性。  相似文献   

17.
hldirect association is a high level relationship between items and frequent itemsets in data. Current research approaches on indirect association mining are limited to indirect association between itempairs,which will discover too many rules from dataset. A formal definition of indirect association between multiple items is presented, along with an algorithm, SET NIA, for mining this kind of indirect associations based on anti-monotonicity of indirect associations and frequent itempair support matrix. While the found rules contain same information as compared to the rules found by indirect association between itempairs algorithms, this notion brings space-saving in storage of the rules as well as superiority for human to understand and apply the ndes. Experiments conducted on two real-word datasets show that SET _ NIA can effectively find fewer rules than existing algorithms which mine indirect association between itempairs,the experimental results also prove that SET_NIA has better performance than existing algorithms.  相似文献   

18.
基于PSO的加权关联规则挖掘算法   总被引:1,自引:0,他引:1  
简要描述了加权关联规则问题及离散粒子群优化算法,提出了一种基于粒子群优化(PSO)算法的加权关联规则挖掘算法(PSO-WMAR).实验证明,本算法运行时间更省,产生的规则数更少且更有效.该算法具有以下特点:1)把关联规则挖掘的两个阶段结合在一起,无须先挖掘出全部频繁项目集然后再提取规则;2)只需要扫描一次数据库;3)把兴趣度引入适合度函数之中,挖掘出的规则数量更少、更有效;4)求加权频繁项目集无须查找所有候选加权频繁项目集,或者求频繁项目集的高序子集或非频繁项目集的低序超集.  相似文献   

19.
Incremental data mining is an attractive goal for many kinds of mining in large databases or data warehouses. A new incremental updating algorithm rule growing algorithm (RGA) is presented for efficient maintenance discovered association rules when new transaction data is added to a transaction database. The algorithm RGA makes use of previous association rules as seed rules. By RGA, the seed rules whether are strong or not can be confirmed without scanning all the transaction DB in most cases. If the distributing of item of transaction DB is not uniform, the inflexion of robustness curve comes very quickly, and RGA gets great efficiency, saving lots of time for I/O. Experiments validate the algorithm and the test results showed that this algorithm is efficient.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号