首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 765 毫秒
1.
基于FP-Growth算法,提出一种并行加权的关联规则挖掘(PWARM)算法,证明其满足加权向下封闭性.使用MapReduce计算模型,在分布式集群中并行挖掘出关联规则.实验结果表明:该算法可以满足数据权重不同的需求,且在处理大数据集时能有效地提高挖掘的效率.  相似文献   

2.
介绍了模糊关联规则挖掘算法的基本思想及实现步骤,提出了模糊关联规则的并行挖掘算法.并行挖掘算法采用并行的模糊c-均值算法将数量型属性划分成若干个模糊集,并借助模糊集软化属性的划分边界.用改进布尔型关联规则的并行挖掘算法来发现频繁模糊属性集.最后由多个处理器并行地产生满足最小模糊信任度的模糊关联规则.在分布式互连的PC/工作站环境下进行性能分析,结果表明并行的挖掘算法具有好的可扩展性、规模增长性和加速比性能.  相似文献   

3.
一种高效并行关联规则挖掘新算法   总被引:1,自引:0,他引:1  
提出了一种在微机集群上实现的高效并行算法。该算法利用矩阵理论中上三角矩阵的良好性质,通过数据库约简、投影等操作,在微机集群的各节点上开展并行挖掘,从而提高挖掘算法的效率和可扩性。在微机集群上的实验证明,该算法能大大提高关联规则的挖掘效率,并具有良好的可扩性。  相似文献   

4.
基于MapReduce的Eclat改进算法研究与应用   总被引:1,自引:0,他引:1  
针对Eclat算法在挖掘海量数据中的频繁项目集时存在的内存和计算资源不足等问题,将Eclat算法与目前流行的大规模数据集并行编程模型MapReduce结合,解决了Eclat算法在数据挖掘过程存在的瓶颈问题,运用于动车组故障诊断系统中,提高了关联规则挖掘的效率.  相似文献   

5.
Web日志挖掘是Web数据挖掘中非常重要的一个研究领域和研究方向,首先介绍了Web日志挖掘的过程,然后介绍了关联规则及关联规则算法——FP-growth算法,最后将关联规则中的FP-growth算法应用在网上书店系统中,实现对客户数据的关联规则挖掘。  相似文献   

6.
针对复杂系统产生的时间序列,研究其局部关联特征比研究系统全局特征模型具有明显的优势.为研究时间序列内部或局部形态的关联特征,首先借助FCM来软化时间序列属性论域的划分边界,然后,采用改进的布尔型属性关联规则并行挖掘算法来发现频繁模糊属性集,最后由多个处理器并行地产生满足最小模糊信任度的模糊关联规则.提出了基于FCM聚类的时间序列模糊关联规则的并行挖掘算法,并通过实验验证了算法的有效性.  相似文献   

7.
针对在关联规则的实际挖掘中,由数据快速增加所造成的大数据问题和增量更新问题?在快速更新频繁模式树算法(fast updated frequent pattern tree,FUFP - tree)的基础上,引入MapReduce 编程模型,提出了一个面向大数据的并行的关联规则增量更新算法(parallel fast updated frequent pattern tree,PFUFP - tree)?该算法通过构建原始事务数据的分块索引,从而使得在每次增量更新时,能够最小化地扫描原始事务数据库,提高了挖掘效率;同时采用动态负载均衡的项目分组策略来优化并行计算过程中的项集分组问题,从而保证分布式集群中节点之间的负载均衡;实验结果证明,提出 的算法是有效的和高效的,适用于动态增长的大数据环境?  相似文献   

8.
基于并行遗传算法的关联规则挖掘   总被引:1,自引:4,他引:1  
根据关联规则挖掘的要求与特点,结合并行遗传算法的思想,通过定义适应度函数,讨论了并行遗传算法在数据挖掘中的应用.结合一个实例,提出了基于并行遗传算法的关联规则的提取算法.  相似文献   

9.
关联规则研究综述   总被引:10,自引:0,他引:10  
关联规则挖掘是近年来数据挖掘研究中一个相当活跃的领域.本文给出了关联规则及相关术语的定义,对关联规则挖掘中的频繁模式、频繁闭模式、最大频繁模式、并行/分布式挖掘及增量挖掘算法作了简单评述,着重介绍了近三年来发表的一些新算法,并对未来的发展趋势进行了预测和展望.  相似文献   

10.
在比较当前几种并行关联规则挖掘算法的基础上,为了解决CD、FDM、DDM算法的候选集和执行时间方面存在的问题,结合关联规则的性质定理,提出了一种改进的并行关联规则算法IPARM.在无共享的工作站机群上进行性能测试,采用改进并行算法的执行效率提高了,达到了算法优化的目的.  相似文献   

11.
聚类多维数字属性的关联规则   总被引:1,自引:1,他引:0  
提出一种有效开采多维数字属性关联规则的算法。为解决返回规则太多的问题,利用聚类技术把开采出来的关联规则进行分类,从而使所开采的规则量显著减少,同时使得结果更易理解。  相似文献   

12.
时态关联规则研究与应用   总被引:4,自引:0,他引:4  
传统关联规则挖掘很少考虑关联规则的时间适用性.时态关联规则是指带有时态约束的关联规则,每个关联规则都有着其成立的时间区域.结合其他算法的特点,提出了基于Fisher聚类的时态关联规则挖掘算法(TApriori算法),它能够动态地发现关联规则以及关联规则有效的时间区域.实验结果证明该算法是合理有效的.最后,结合具体CRM项目的特点,讨论了在CRM引入数据挖掘的体系结构,给出了一个应用.  相似文献   

13.
网络数据包安全指标关联规则挖掘应用与研究   总被引:2,自引:2,他引:0  
对网络通信中,安全指标间关联规则的挖掘速度缓慢问题进行研究。网络通信数据的高容量、多样性和复杂性,使网络安全指标间关联规则挖掘的信息处理难度较高、时间效率低,为此提出一种基于并行FP-树频集算法的关联规则数据挖掘方法并成功应用于网络通信的安全指标挖掘中。首先对网络通信数据进行Netflow流量数据采集,对其进行预处理以信息熵的形式存储。然后将频集压缩到频繁模式树上,再引入并行算法在多个处理器上为频繁模式树的节点创建条件模式库和条件模式树,在不同的并行处理器上进行同时处理,最后生成反映网络安全信息的关联规则。该方法提高了网络信息安全指标间关联规则挖掘的效率,在同样的支持度阈值和置信度阈值的条件下,可减少处理时间4~7 s。  相似文献   

14.
 针对现有拓扑关联规则挖掘算法不能够有效地提取长频繁约束拓扑关联规则,提出一种基于区间映射的约束拓扑关联规则挖掘算法,该算法适合挖掘带约束空间布局关系的长频繁拓扑关联规则;该算法用区间映射法的下行搜索策略产生候选频繁拓扑项目集,利用逻辑"与"运算计算拓扑关系事务的支持数.实验证明在挖掘长频繁约束拓扑项目集时,该算法比现有算法更快速更有效.  相似文献   

15.
针对海量数据的关联规则挖掘问题,提出了一种有效的基于等价类划分的并行频繁闭项集挖掘算法.该算法在MapReduce框架下,通过等价类的产生与划分、数据集的分配、异步频繁闭项集挖掘和汇总等步骤,不但较好地解决了多节点间的负载均衡问题,而且易于获得可靠的频繁闭项集.实验表明,该算法能有效克服传统算法挖掘效率低、冗余规则较多的缺点,整体上具有较高的性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号