首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
白连红  徐澍 《科技信息》2009,(24):201-202
本文提出了商业应用系统中进行数据挖掘的改进的Apriori算法和对点击流数据进行挖掘的多支持度的关联规则方法,并结合具体数据进行了分析。改进了算法,在实践中可以有效地提高系统数据挖掘的效率。  相似文献   

2.
通过探讨了网络教学中数据挖掘的常用方法,介绍了关联规则及Apriori算法,对该算法进行改进,并将改进的Apriori算法运用到实例,在网络教学中实现了个性化网页的推荐,提高了算法的效率.  相似文献   

3.
关联规则是数据挖掘的一个基本方法,本文首先介绍传统的Apriori算法的过程,分析它在处理大数据集时存在的问题.提出关联规则的一种改进算法,称为哈希修剪算法.然后比较改进的算法与传统的Apriori算法在算法时间复杂度、性能上的差异.通过实验得出,哈希修剪算法在数据挖掘中能够更加有效的处理数据.  相似文献   

4.
为了有效提高动车组滚动轴承故障的发现率,减少故障监控系统的误报现象,基于Apache Hadoop大数据平台对经典Apriori算法进行改进,并将其应用于动车组滚动轴承故障的预测研究工作中。首先,针对经典Apriori算法的不足,在MapReduce框架下提出以业务经验为约束的改进的Apriori算法。其次,基于文中提出的改进的Apriori算法对某铁路局的动车组状态、故障预警、维修历史等信息进行深度数据挖掘,并通过得出的关联规则进行动车组滚动轴承故障的预测。实验结果表明,文中提出的算法准确率达72%,减少了80%以上的误报报警信息,在实验环境中运算效率较传统的Apriori算法提高了50%。  相似文献   

5.
对云计算技术和数据挖掘进行研究,分析Apriori算法,针对其局限性,提出优化方案,引入云计算中MapReduce模型,实现并行化。提出一种基于MapReduce的频繁项集挖掘方法,以提高算法的运行效率,降低算法执行所需的开销。  相似文献   

6.
针对经典的Apriori算法依赖内存,只适用于小规模数据集,在面对海量数据集时显得无能为力以及该算法没有考虑用户的需求情况等问题,提出了基于MapReduce的Apriori前后项约束关联规则改进算法。该方法首先对经典Apriori算法挖掘过程进行了改进,加入了用户的前后项约束规则,使得在挖掘过程中剪枝的程度更大并且获取到更加精准的规则。然后利用云计算的MapReduce编程技术,对改进的Apriori算法的各个步骤并行化。实验结果表明,改进的算法在处理不同的数据集时有一定的优势,然后经过MapReduce模型并行化后,提高了对海量数据的处理能力和效率,并且具有良好的扩展性。  相似文献   

7.
Apriori算法是一种经典的基于关联规则的数据挖掘算法,在研究Apriori算法及其现有改进方法的基础上,提出了一种全新的从高维向低维扫描的Apriori改进算法,并与传统Apriori算法进行比较分析。结果表明该改进算法可有效地减少数据库扫描时间和额外空间占有量。  相似文献   

8.
数据挖掘技术己经引起了信息产业界的广泛关注。关联规则是其中一个主要的研究方向,有着广泛的应用价值。对数据挖掘中的关联规则挖掘算法进行了研究和探讨,包括数据挖掘的概念、数据挖掘的理论基础、数据挖掘的主要问题和数据挖掘的分类等。Apriori算法是发现频繁项目集的经典算法,但是该算法需反复扫描数据库,因此效率较低。在分析分析总结了关联规则中经典的Apriori算法及其改进算法的基础上,提出了一种挖掘算法的改进思想,并通过一个实际例子对改进算法和原算法做了分析和比较,以及对关联规则进行了展望。  相似文献   

9.
基于关联规则挖掘算法的改进研究   总被引:1,自引:1,他引:0  
数据挖掘应用极大地推动了人们掌握、处理信息的能力.文章主要介绍了数据挖掘中的关联规则,关联规则中的经典算法Apriori算法,以及Apriori算法存在的不足,提出了Apriori算法的改进研究.  相似文献   

10.
因初始项集中的数据特征相关,使关联规则Apriori算法的数据挖掘结果存在误差.为了解决这个问题,结合粗糙集理论(RST),提出一种改进的关联规则数据挖掘算法;然后,将该算法应用到软件工程风险因素和风险缓解因素管理分析中,提出一种新的软件工程适应性结构.仿真结果表明,该改进算法提高了挖掘数据的效率.  相似文献   

11.
关联规则挖掘是从大量的数据中挖掘出有价值描述数据项之间相互联系的有关知识.对于大型数据库来说,有算法的执行时间太长等问题.分析和探讨了Apriori算法,提出了基于Apriori算法的一种有效的关联规则挖掘算法,减少了数据库I/O操作时间,从而提高了效率.  相似文献   

12.
针对数据挖掘中经典的Apriori算法在计算频繁项目集时需消耗大量的时间缺点,文中利用多线程并行计算的特点,提出了基于线程并行计算的Apriori算法,该算法是将统计候选项目个数的任务交给多线程来执行,从而达到减少Apriori算法的运行时间。通过实验数据分析,该算法对减少Apriori算法的运行时间有很大的提高。  相似文献   

13.
在海量数据的关联规则数据挖掘中,采用并行计算是非常必要的;针对当前的关联规则算法,运用并行算法的思想,结合云计算环境下的Hadoop架构,提出了Hadoop下的并行关联规则算法的设计,最后实验表明,该算法能处理节点失效,并且能实现节点负载均衡。  相似文献   

14.
大数据(Big Data)这个概念近年来在越来越多的场合、被越来越多的人提及,并且经常和云计算联系在一起,云计算与大数据之间到底是什么关系成为热点话题。本专题报告包含以下四个方面内容:1.大数据的价值;2.大数据带来的挑战;3.大数据研究成果;4.云计算是大数据挖掘的主流方式。通过本报告阐述我们对大数据的理解,以及对大数据的价值的认识,探讨大数据处理与挖掘技术,论述以下观点:没有互联网就没有云计算模式,没有云计算模式就没有大数据处理技术,也就没有大数据挖掘技术。  相似文献   

15.
云计算技术是海量数据挖掘的一种高效解决方案,将MapReduce并行计算模型与粗糙集属性约简算法相结合,提出一种基于MapReduce的浓缩布尔矩阵并行属性约简算法.该算法提高了粗糙集属性约简算法对大数据的处理能力和效率,并能适应云计算环境.实验结果表明,所提算法具有良好的效率、加速比和可扩展性.  相似文献   

16.
 因特网上的数据越来越多、越来越复杂,这些异构、动态、分布的信息使得传统数据挖掘方式已经不能达到实际要求。本文提出了一种面向web 数据挖掘的改进型迭代算法,将迭代方法与多服务器并行算法进行结合,并采用该算法建立了一个支持并行关联规则的web 数据挖掘模型,融合存储节点本地计算的思想。实验证明,该模型能够提高web 数据挖掘的效率,并有随着数据量增加执行率升高的特点。  相似文献   

17.
为在Web日志数据中挖掘关联规则以指导信息无障碍网站的设计与开发, 针对大量用户对网站页面URL(Uniform Resoure Locator)的访问频率等信息, 通过Apriori算法实
现数据挖掘, 以寻找用户访问页面之间的关联规则。根据3次点击原则及网站结构设计的特点, 对Apriori 算法网页超链接挖掘的过程进行了改进, 频繁项集最多只需找出所有3
-项集即可。算法实现过程表明, 该方法可有效降低算法的时间复杂度, 能通过对关联规则的分析确定用户感兴趣的网页类型, 找出用户所访问网页之间的链接关系。  相似文献   

18.
李仁  段隆振  周青  李光辉 《江西科学》2008,26(2):295-299
在分析关联规则挖掘Apriori算法时,从信息粒的角度出发,根据二进帝j粒计算的表示方法和Apriori算法中的相似性及交互性,提出了一种用二进制粒计算采表示的Apd槲改进算法,即使用二进制粒计算求出频繁项目集。方法不仅简洁、方便、逻辑性强,而且更适合于计算机运算。  相似文献   

19.
基于云计算的移动智能旅游导览系统   总被引:1,自引:0,他引:1  
目前,各地旅游信息化资源形成一个个信息孤岛,且没有完善的面向游客和导游的移动智能导览系统平台。针对这个问题,提出以云计算来建立后端信息存储和处理中心,以移动通信网络、物联网、互联网技术结合作为前端展示终端和接口,以高性能信息处理、数据挖掘和智能推荐技术为信息处理支撑,建立为游客和导游提供信息服务的基于云计算的移动智能旅游导览系统。案例分析表明:系统模型具有较高的可应用性和可扩展性,且有助于更高效地实现旅游管理和监控。  相似文献   

20.
文章提出了建筑用电设备物联网与云计算平台融合应用的思路,通过这种途径,在降低硬件投入成本的前提下,很好地解决了大规模应用建筑用电设备物联网时,可能出现的节点错误、服务器瘫痪等现象.两者的融合应用必然具有广阔的前景.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号