首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
提出一种基于AprTidRec算法的分布武关联规则挖掘算法,并通过实验验证了算法运行的有效性。给出基于局部一全局通信模式的分布式关联规则挖掘方案,并在此方案基础之上进行了系统实现。  相似文献   

2.
自动地从数据库中挖掘关联规则是非常重要且十分有用的,这是因为已开发和研制的数据广泛地遍布于整个世界。关联规则的不确定性由两个因子:支持度和可信度来度量.该文研究和给出已有的度量的性质,为进一步开发数据挖掘软件提供参考。  相似文献   

3.
用关联规则方法挖掘保险业务数据中的投资风险规则   总被引:9,自引:0,他引:9  
如何找出保险业务数据中有关投保和理赔的规律是保险公司能否提高盈利的至关重要的问题。关联规则发现是数据挖掘技术的一种简单又很实用的方法。文章首先介绍了关联规则的定义以及关联规则的 4个属性 :可信度、支持度、期望可信度和作用度。然后讲述了如何用 SGI公司的数据挖掘工具 Mineset在保险业务数据中发现关联规则 ,从而得出一些对保险公司起指导作用的控制投资风险的规则。关联规则还可广泛用于银行、电信、商业等其它领域  相似文献   

4.
传统的关联规则挖掘技术是从包含一组事务记录的数据库中发现一些事务项目间关系的信息。本文的工作,是致力于将关联规则的概念引入到Web日志挖掘系统中,将用户的访问路径以关联规则的形式表现出来,其目的在于从用户访问超文本系统的行为中发现用户的访问模式。将超文本系统看成是一种有向加权图,经过对可信度和支持度的重新定义,使之适合于用来表示用户的访问路径,并引出复合关联规则挖掘算法。  相似文献   

5.
数据挖掘本质上是一种新的商业信息处理技术,通过对数据进行统计、分析、综合和推理,发现数据间的关联性、未来趋势以及一般性的概括知识,用以指导高级商务活动。由于需要,对数据间的关联性的数据挖掘算法模型已成为数据库及相关领域的一个研究热点,给出了一种基于分布式数据库的挖掘模型及其相应的一种有效的挖掘算法,其由若干个站点集合而成,各个站点拥有各自的数据库、中央处理机、客户端,以及各自的局部数据库管理系统,依靠通讯网络连接。采用购物篮分析式关联规则,将各个数据库文件的数据合成,从而得到挖掘结果,对挖掘的方法又进一步挖掘,即将不满足条件的规则重新传送到各分布式站点上进行更加精确的挖掘处理,从而避免了频繁的网络通讯。该算法在减轻网络频繁的通讯负担,体现并行计算以及异构数据挖掘方面具有独特优点。  相似文献   

6.
通过对关联规则兴趣度的度量,在挖掘关联规则时可以避免无意义规则的产生。提出了一种度量关联规则兴趣度的方法,并给出了兴趣关联规则的挖掘算法。  相似文献   

7.
基于关系代数的关联规则挖掘算法   总被引:3,自引:0,他引:3  
目的提出基于关系代数理论的关联规则挖掘算法。方法利用数据预处理方法,剔除无关属性、获得相应的目标特征子集。结果基于目标特征子集,利用关系矩阵及相关运算给出了搜索大项集的基于关系代数理论的优化的关联规则挖掘算法,该算法只需扫描数据库一次。结论克服了经典的Apriori算法需要多次扫描数据库的缺点,同时算法具有良好的并行性和可伸缩性。  相似文献   

8.
关联规则挖掘主要用来发现数据库中存在的频繁项集.利用权值标识项目的重要程度,提出一种新的关联规则——加权关联规则的挖掘.由于项目权值的引入,Apriori性质不再成立,频繁项集的子集不再一定是频繁的.为此,提出k-最小支持数的概念,对原有Apriori算法进行改进.该算法能够挖掘出现频率小但是带来更大利润的项目,使得挖掘出的关联规则更加满足决策者的需求,也更加符合实际需要.  相似文献   

9.
对经典算法ML—T2的剪枝策略进行了详细的研究,并针对其剪枝过程中存在的问题提出一种改进型的多级关联规则算法IML。  相似文献   

10.
关联规则挖掘中层次算法的研究   总被引:1,自引:0,他引:1  
对层次算法中的Apriori、AprioriTid等典型算法进行了分析、探讨和评价。  相似文献   

11.
针对分布式数据库和约束条件的特点,提出了2种在分布式环境下挖掘约束性关联规则的有效算法,即基于Apriori算法的DMAIC算法和基于频繁模式树的DAMICFP算法.此外,进行了实例验证和测试分析,指出了这2种算法各自的优缺点及适用条件.研究结果表明:DMAIC算法可靠性高,通信协议简单,适用于对通信性能要求不高的分布式数据库;DAMICFP算法执行效率高,通信性能好,适用于对通信性能要求较高的多项目分布式数据库;这2种算法均能有效地解决分布式挖掘约束性关联规则的问题.  相似文献   

12.
提出了在分布式环境下对于每一层使用不同支持度的时态关联规则挖掘问题及其算法DMARM。该算法使用轮询方法处理分布式系统中各个节点间的通讯问题,在各个节点上利用集合“或”和“与”运算,在求候选频繁模式的同时求出了模式的支持度,减少了数据库的扫描次数。  相似文献   

13.
为了解决模糊关联规则挖掘算法需要用户事先给定模糊集和相应隶属度函数的问题,提出基于分布式聚类自动生成模糊集及隶属度函数的算法GFAM.该算法利用分布式K—Means聚类算法对每个数值型属性进行聚类,求得聚类中心,由此构造全局模糊集,定义全局隶属度函数.DFAR算法根据构造的全局模糊集及隶属度函数进行分布式模糊频繁项目集的快速挖掘,采用全局一局部站点模式,其中包括局部模糊频繁项目集产生算法FLF和全局模糊频繁项目集产生算法FGF.实验结果表明,该算法能准确地生成全局模糊频繁项目集,在求解全局模糊频繁项目集过程中,传送局部模糊候选项目集支持数的通信量为O(n),提高了算法的挖掘效率.  相似文献   

14.
为了解决模糊关联规则挖掘算法需要用户事先给定模糊集和相应隶属度函数的问题,提出基于分布式聚类自动生成模糊集及隶属度函数的算法GFAM.该算法利用分布式K-Means聚类算法对每个数值型属性进行聚类,求得聚类中心,由此构造全局模糊集,定义全局隶属度函数.DFAR算法根据构造的全局模糊集及隶属度函数进行分布式模糊频繁项目集的快速挖掘,采用全局-局部站点模式,其中包括局部模糊频繁项目集产生算法FLF和全局模糊频繁项目集产生算法FGF.实验结果表明,该算法能准确地生成全局模糊频繁项目集,在求解全局模糊频繁项目集过程中,传送局部模糊候选项目集支持数的通信量为O(n),提高了算法的挖掘效率.  相似文献   

15.
传统的关联规则只关注于挖掘出项集间的正关联规则,但在实际应用中负关联规则同样隐含着有价值的信息.本文首先给出了正、负关联规则的定义及支持度和置信度的函数表示,重点分析了关联规则中"支持度—置信度"架构的局限性,提出了利用项集的相关性来解决关联规则中正、负矛盾规则出现的问题,同时针对置信度的设置进行了研究分析,最后对负关联规则挖掘的算法进行了讨论,旨在为关联规则的研究奠定基础.  相似文献   

16.
数据库中标准加权关联规则挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
在原有的关联规则挖掘算法的研究中,认为所有的属性的重要程度相同,提出标准加权关联规则的挖掘算法,能够解决因属性重要程度不一样带来的问题。  相似文献   

17.
数据挖掘在各行业发挥着越来越重要的作用,随着数据挖掘中数据量的高速增长以及大规模计算在数据挖掘中的应用,挖掘算法处理海量数据的能力问题日益突出。研究并行算法是解决这一问题的有效途径,该文对常见的数据挖掘关联规则及聚类并行算法进行了研究探讨。  相似文献   

18.
对数据挖掘关联分析的剪裁   总被引:1,自引:0,他引:1  
利用属性间的相互关系对关联分析进行剪裁,针对关联分析会得到过多的属性间关系这一问题,分析了影响关联分析结果的诸多因素,提出了对包容关系,递推关系以及互递关系的剪裁算法,经实例运算表明,新算法能有效地剪裁关联分析所得到的结果关系集合,在此基础上,对几种关系剪裁算法进行了比较和讨论,并提出了一些改进设想。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号