首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
对具有连续属性的数据进行关联规则挖掘,构造了一种新的编码方式,采用三段式染色体(个体),将连续属性离散化、属性约简和规则提取集成在一起,并将小生境引入到遗传算法中,以避免早熟现象.实验表明,该算法是有效的.  相似文献   

2.
张志锋 《科学技术与工程》2012,12(26):6640-6643
如何有效地从具有连续属性的数据中挖掘关联规则,是目前数据挖掘领域的一个研究热点。论文基于遗传算法,提出了一个连续属性关联规则挖掘方法。在该方法中,首先采用三段式编码将连续属性离散化、属性约简和规则提取集成在一起,然后将小生境引入到遗传算法中,以避免早熟、提高挖掘效率。实验表明,该方法是有效的。  相似文献   

3.
研究了基于联合熵和粗糙集理论的关联规则挖掘算法,改进了基于粗糙集的属性离散化方法—连续属性联合熵差离散化算法;以联合信息熵作为属性约简的标准,提出了基于联合熵的知识约简算法;并给出了以支持度、兴趣度和准确度为阈值的有效关联规则算法.  相似文献   

4.
针对病理诊断规则获取问题,采用基于粗糙集理论的规则提取方法.首先进行连续属性的离散化,用遗传算法对CAIM(class-attribute interdependence maximum)离散化算法进行改进.然后利用粗糙集理论进行规则提取.采用以核为基础的增量式约简算法,综合考虑属性对约简的增益和属性在剩余属性集中的重要性,给出了衡量属性重要性程度的一个准则.随后进行属性值约简,获取诊断规则.  相似文献   

5.
关联规则挖掘方法自提出以来已有很多改进算法,但均局限于布尔关联规则的挖掘.已有的数量关联规则挖掘主要考虑了连续属性值离散化、最优的数量关联规则挖掘等问题,但存在过小支持度和过小置信度问题.研究了这一问题并提出了一个在频繁2-项集的基础上挖掘数量关联规则的改进算法.它不仅可以用于典型的购物篮分析,还可以用于购物篮分析不能完成的关联规则挖掘问题,如带数量的捆绑销售问题.  相似文献   

6.
一种多维关联规则算法的研究   总被引:2,自引:0,他引:2  
针对目前很少有一整套能同时处理量化属性和分类属性字段的多维关联规则的解决方法,对将单维关联规则的Aprior算法改进为量化属性的静态离散化多维关联规则的算法进行了研究,并以实例阐述了该算法在电子商店中的应用,分析了其商业价值。  相似文献   

7.
一种基于粗糙集理论的连续属性离散化方法   总被引:14,自引:0,他引:14  
基于粗糙集的有关理论,提出了一种新的连续属性离散化方法·首先说明决策属性支持度的概念,再利用决策属性支持度作为反馈信息,提出一种领域独立的基于决策属性支持度的连续属性离散化算法·该算法能在保证决策表原始分类能力不变的前提下,提高约简效率·同时,各个属性拥有较少的分割区间,会使规则集合更加简洁·通过实例分析比较,说明该算法是非常有效的·  相似文献   

8.
 针对现有拓扑关联规则挖掘算法不能够有效地提取长频繁约束拓扑关联规则,提出一种基于区间映射的约束拓扑关联规则挖掘算法,该算法适合挖掘带约束空间布局关系的长频繁拓扑关联规则;该算法用区间映射法的下行搜索策略产生候选频繁拓扑项目集,利用逻辑"与"运算计算拓扑关系事务的支持数.实验证明在挖掘长频繁约束拓扑项目集时,该算法比现有算法更快速更有效.  相似文献   

9.
针对基于形式概念分析的关联规则提取侧重属性之间的正关联、忽略负关联的问题,提出一种基于三支概念分析的关联规则提取算法(3ARM)。利用对象导出三支概念的内涵包括表达"共同具有"语义的正属性子集和表达"共同不具有"语义的负属性子集的特点,结合三支概念格的泛化与例化结构,高效地提取正负关联规则;基于三支概念的闭项集特性,从三支概念格中选出包含频繁项集的候选概念进行挖掘,减少不必要的搜索;通过对三支概念之间的关系进行研究,从父子概念中提取无冗余的正关联规则和负关联规则,再从兄弟概念中提取正负规则对规则集进行补充,充分挖掘三支概念格中的知识。MovieLens数据集上的实验结果表明:应用3ARM算法,在最小支持度为10%时,得到正规则86 027条,负规则93 685条;3ARM算法得出的正规则数量比FARM算法的多出0.9倍~1.5倍,减少了FISM算法最多28.3%的冗余负规则,分别减少了FISM和FARM算法44%~63%和27%~62%的运行时间。  相似文献   

10.
基于粗糙集方法提出了一种系统的决策表约简和决策规则提取方法. 为了避免现有属性离散化方法的不足,使用多元统计中的聚类分析,并借助树形图,R2、半偏相关以及伪F统计量,对连续属性进行离散化处理,得到适合粗糙集方法要求的决策表. 在此基础上,简化了基于可辨识矩阵和逻辑运算的传统属性约简算法,并完善了启发式算法进行属性值约简和决策规则提取. 最后,以应用实例验证了该方法的可行性和有效性.  相似文献   

11.
通过介绍从包含定量和定性属性的大型关系表中开采相关规则的问题 ,同时将关系表中的属性值分区 ,并且用相联相邻的分区来处理定量属性 ,引进部分完全性方法量化由于分区丢失的信息 直接应用这种方法会产生大量相似的规则 ,为此 ,引用一种概率的方法确定输出感兴趣的规则 这种技术可应用在现实的数据库上  相似文献   

12.
挖掘关注的语言值关联规则   总被引:1,自引:0,他引:1       下载免费PDF全文
为了解决利用RFCM算法划分数量型属性,并通过组合语言值进行语言关联规则挖掘中出现的规则数量太多,以及难于获得用户真正关注的规则等问题,提出了一种改进的语言值关联规则挖掘算法。通过最大隶属原则将记录在数量型属性上的取值转换为语言值,然后转换成布尔型属性关联规则挖掘问题。同时,给出一个能够度量语言值关联则简洁性和新奇性关注程度(兴趣度)的计算函数,用于减少选取关注语言值关联规则的工作量。采用本文提出的方法对一组实例数据进行实验,得到了关注程度较高的语言值关联规则。所采用的方法能适用于含有大量数量型属性的数据库,并能有效地获取用户关注的规则。  相似文献   

13.
基于模式矩阵的FP-growth改进算法   总被引:10,自引:0,他引:10  
数据挖掘中关联挖掘算法比较典型的有Apriori和FP—growth算法.实验和研究证明FP—growth算法优于Apriori算法.但是针对大型数据库这两种算法都存在着较大缺陷,不仅要两次或多次扫描数据库,而且很难处理支持度和数据变化等关联规则更新问题.作者提出了基于模式矩阵的FP—growth改进算法,它至多扫描数据库一次,特别在更新问题上不用重新扫描数据库.通过实验结果分析,验证了这种改进算法相对于原有FP—growth算法的优势,特别在大数据集下,大大降低了挖掘的时间复杂度.  相似文献   

14.
本文引入在关系数据库中包含定量和范围属性关联规则的挖掘问题 ,这种技术的一个直接应用可以生成许多类似的规则。给出为挖掘定量关联规则所需的兴趣度量及常项集产生的算法。  相似文献   

15.
一种关系数据库中基于云模型关联规则的提取   总被引:2,自引:1,他引:2  
为了发现有效的关联规则,属性在比较高的水平被范化,允许相邻属性值或者语言项的重量.这种软划分可以映射人类的想法,同时使发现的知识鲁棒.利用云模型的理论与方法求解数量关联问题,给出了一种云关联规则的定义,并提出了基于云模型理论支持度和置信度的计算方法,最后提出了一种提取算法Cloud model A.这种方法较好地软化了数量属性论域的划分边界,从而使得挖掘出的云关联规则更容易被人理解。  相似文献   

16.
In data mining from transaction DB, the relationships between the attributes have been focused, but the relationships between the tuples have not been taken into account. In spatial database, there are relationships between the attributes and the tuples, and most of the associations occur between the tuples, such as adjacent, intersection, overlap and other topological relationships. So the tasks of spatial data association rules mining include mining the relationships between attributes of spatial objects, which are called as vertical direction DM, and the relationships between the tuples, which are called as horizontal direction DM. This paper analyzes the storage models of spatial data, uses for reference the technologies of data mining in transaction DB, defines the spatial data association rule, including vertical direction association rule, horizontal direction association rule and twodirection association rule, discusses the measurement of spatial association rule interestingness, and puts forward the work flows of spatial association rule data mining. During twodirection spatial association rules mining, an algorithm is proposed to get nonspatial itemsets. By virtue of spatial analysis, the spatial relations were transferred into nonspatial associations and the nonspatial itemsets were gotten. Based on the nonspatial itemsets, the Apriori algorithm or other algorithms could be used to get the frequent itemsets and then the spatial association rules come into being. Using spatial DB, the spatial association rules were gotten to validate the algorithm, and the test results show that this algorithm is efficient and can mine the interesting spatial rules.  相似文献   

17.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有意义的关联。随着大量数据不停的收集和存储,从数据库中挖掘关联规则显得越来越有必要性,关联规则挖掘的Apriori算法是数据库挖掘的最经典算法并得到广泛应用,在介绍关联规则挖掘和Apriori算法的基础上,发现Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。综述了Apriori算法的主要优化方法,并指出了Apriori算法在实际中的应用领域,提出了未来Apriori算法的研究方向和应用发展趋势。  相似文献   

18.
In data mining from transaction DB, the relationships between the attributes have been focused, but the relationships between the tuples have not been taken into account. In spatial database, there are relationships between the attributes and the tuples, and most of the associations occur between the tuples, such as adjacent, intersection, overlap and other topological relationships. So the tasks of spatial data association rules mining include mining the relationships between attributes of spatial objects, which are called as vertical direction DM, and the relationships between the tuples, which are called as horizontal direction DM. This paper analyzes the storage models of spatial data, uses for reference the technologies of data mining in transaction DB, defines the spatial data association rule, including vertical direction association rule, horizontal direction association rule and two-direction association rule, discusses the measurement of spatial association rule interestingness, and puts forward the work flows of spatial association rule data mining. During two-direction spatial association rules mining, an algorithm is proposed to get non-spatial itemsets. By virtue of spatial analysis, the spatial relations were transferred into non-spatial associations and the non-spatial itemsets were gotten. Based on the non-spatial itemsets, the Apriori algorithm or other algorithms could be used to get the frequent itemsets and then the spatial association rules come into being. Using spatial DB, the spatial association rules were gotten to validate the algorithm, and the test results show that this algorithm is efficient and can mine the interesting spatial rules.  相似文献   

19.
定量关联规则的挖掘   总被引:2,自引:0,他引:2  
介绍在关系数据库中包含定量和范围属性关联规则的挖掘问题,给出一些定义和方法,引人局部完备性来度量由于划分而引起大量信息的丢失程序,决定是否划分一个定量属性及划分数。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号