首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 546 毫秒
1.
网格计算环境下的分布式数据挖掘   总被引:4,自引:0,他引:4  
为了提高分布式挖掘系统的性能,分析了现有的分布式数据挖掘系统的不足,提出了一种网格计算环境下的分布式数据挖掘的体系结构,讨论了在该体系结构下如何进行数据挖掘.该体系结构是面向服务的,跨平台的,在该体系结构中,挖掘算法和目标数据源被定义为web服务资源,在需要进行数据挖掘的时候,这些web服务资源被动态地、松耦合地联接在一起,共同完成一次数据挖掘任务.最后,借助网格工具globus toolkit4.0构建了一个局域网网格计算环境,并使用一个关联规则挖掘实例详细地说明了在该体系结构下的挖掘过程,  相似文献   

2.
在分布式系统中如何挖掘关联规则是数据挖掘领域研究的一个重要课题.对关联规则分布式挖掘问题进行了深入探讨.基于以P2P网络模式构建的分布式事务数据库,对Apriori算法进行了推广.改进后的算法具有扩展性好、效率高、通信代价小和实现简单等优点.最后,还提出了一种由频繁项集高效产生强关联规则的算法.  相似文献   

3.
在网格环境中进行分布式的知识发现和挖掘受到越来越多的关注。分布式环境中,数据常常是自治的,异构的,地理是分布的。在这种复杂的环境下进行数据挖掘与传统的在本地进行数据挖掘相比,给人们提出了许多新的挑战。文中根据网格技术、Web服务技术的特点,提出了利用Web服务实现资源(数据和算法资源)共享和动态调用,在网格环境下进行数据挖掘的框架。该框架的实现是建立在基本的网格服务的平台(Globus 3.0 Alpha toolkit)之上的。  相似文献   

4.
数据挖掘技术己经引起了信息产业界的广泛关注。关联规则是其中一个主要的研究方向,有着广泛的应用价值。对数据挖掘中的关联规则挖掘算法进行了研究和探讨,包括数据挖掘的概念、数据挖掘的理论基础、数据挖掘的主要问题和数据挖掘的分类等。Apriori算法是发现频繁项目集的经典算法,但是该算法需反复扫描数据库,因此效率较低。在分析分析总结了关联规则中经典的Apriori算法及其改进算法的基础上,提出了一种挖掘算法的改进思想,并通过一个实际例子对改进算法和原算法做了分析和比较,以及对关联规则进行了展望。  相似文献   

5.
提出一种有效的基于概念格的分布式挖掘算法,重点讨论由部分量化规则格提取的部分关联规则的合并技术,由于能对已存在关联规则的再利用,从而更有利于用概念格来挖掘关联规则.该算法根据对局部关联规则挖掘结果的分布式合成,有利于减轻网络频繁的通讯负担,体现并行计算、异步异构数据挖掘的优点.  相似文献   

6.
介绍了数据挖掘中的多维关联规则算法,针对高校数字图书馆数据库的特点,对多维关联规则算法进行改进,并运用到挖掘过程中.通过分析数据挖掘结果,探索学生借阅书刊的一些潜在规律,优化图书馆的馆藏布局,为读者提供有特色的个性化服务.  相似文献   

7.
保持隐私是未来数据挖掘领域的焦点问题之一,如何在不共享精确数据的条件下,获取准确的数据关系是保持隐私的数据挖掘的首要任务.本文利用向量点积方法从垂直型分布数据中挖掘关联规则,并且保持其隐私性.给出了数量积算法和隐私挖掘的步骤,最后举例说明了如何利用数量积算法进行垂直型分布式数据挖掘.  相似文献   

8.
关联规则研究综述   总被引:10,自引:0,他引:10  
关联规则挖掘是近年来数据挖掘研究中一个相当活跃的领域.本文给出了关联规则及相关术语的定义,对关联规则挖掘中的频繁模式、频繁闭模式、最大频繁模式、并行/分布式挖掘及增量挖掘算法作了简单评述,着重介绍了近三年来发表的一些新算法,并对未来的发展趋势进行了预测和展望.  相似文献   

9.
隐私保护是当前数据挖掘领域中一个十分重要的研究方向,其目的是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果.为了提高对隐私数据的保护程度和挖掘结果的准确性,研究了一种基于向量点积的分布式关联规则挖掘算法.此算法在分布式环境下,利用保持隐私数据挖掘的基本方法和安全两方计算协议,可以在不泄露任何隐私的基础上有效地对垂直型数据分布进行挖掘.  相似文献   

10.
针对云计算环境下由于数据缺失导致关联规则发现误差较高的问题,提出一种基于张量分解的缺失关联规则分布式发现算法,从而建模关联规则、缺失数据并近似它们的置信度.利用Apriori算法进行局部数据相关以获得频繁项集,通过CANDECOMP/PARAFAC (CP)分解方法分解张量置信度,使用共轭梯度算法进行迭代以最小化近似张量的成本,当存在缺失数据的情况下,利用分布式算法将局部相关与全局相关结合发现缺失关联规则.仿真结果显示,算法的平均误差仅为5.55%,最大误差不超过10%,低于其他几种较新的缺失关联规则算法,相比基于聚类的关联规则算法,平均执行时间减少了16.5%.结果表明,所提基于张量分解的分布式算法在缺失数据的情况下,性能优于其他的关联规则算法,能更加有效地提供缺失规则置信度的近似解.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号