首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
分析了云计算和数据挖掘的关系,研究了SLIQ和SPRINT两种数据挖掘算法,提供了一种数据存储量不断增加时基于动态云模型的数据挖掘算法。  相似文献   

2.
时代在不断的进步,科技是发展的原动力,放眼近几年的发展,我们不难看出发展带给我们的巨大的变化,在每个领域体现的都非常的明显。信息产业也是不例外的,人们都说我们步入了一个信息的时代,在这个时代里信息的传递与交流是不可少的,像是我们的学习,商务以及很多的其他的方面,这些方面在今天已经离不开了现代化的信息参与。正是因为这样的原因,我们在这一领域在不断的进行探索,目的就是在这一领域更好的满足今天人们的需求,云计算的物联网数据挖掘模式是我们今天探索的一个非常重要的方向,这篇文章就是对于这些方面展开了讨论,希望能够带给大家更多的启示。  相似文献   

3.
Apriori算法是经典的关联规则挖掘算法,主要缺点是可能产生大量的候选集和需要多次扫描数据库.从幂集运算的角度提出了一种新的关联规则挖掘算法P_DM算法,实现了只需要扫描一次数据库就产生所有频繁集.实验证明这种算法在中小规模数据挖掘上效率优于Apriori算法.  相似文献   

4.
一种改进的Apriori算法   总被引:1,自引:0,他引:1  
Apriori算法存在许多可以改进的地方.例如它需要反复读取数据库,并且读取的次数由项目集中的项目个数来确定,I/O负载与最大项目集的项数成正比.本文提出一种只读一次数据库的的改进算法.  相似文献   

5.
一种改进的Apriori算法   总被引:3,自引:0,他引:3       下载免费PDF全文
介绍了关联规则挖掘的情况,并在分析关联规则的数据挖掘算法的基础上,提出一个改进的Apriori算法.新算法仅对数据库扫描一次,就能找出所有的频繁项集,从而提高了挖掘的效率,具有一定的实用性  相似文献   

6.
Apriori算法是关联规则挖掘中最经典的算法,但它存在两大致命缺陷:需多次扫描数据库和产生海量的候选项目集。从这两个角度出发改进算法,提出了一种基于模式矩阵的高效改进算法(简称P-Matrix算法),使扫描数据库的次数减少为一次,同时不产生候选项目集而直接产生频繁项目集,从而使算法的时间复杂度和空间复杂度大大减少,有效地提高了Apriori算法的效率。  相似文献   

7.
因初始项集中的数据特征相关,使关联规则Apriori算法的数据挖掘结果存在误差.为了解决这个问题,结合粗糙集理论(RST),提出一种改进的关联规则数据挖掘算法;然后,将该算法应用到软件工程风险因素和风险缓解因素管理分析中,提出一种新的软件工程适应性结构.仿真结果表明,该改进算法提高了挖掘数据的效率.  相似文献   

8.
针对经典的求解单行直线型布局算法中需要大量参数、要求设备等概率使用的限制,提出了一种基于数据挖掘的制造业工厂设备布局方法 FMDM.FMDM采用数据挖掘Apriori算法对已有的生产调度计划或柔性作业车间调度问题的调度解进行挖掘,根据贪心方法在频繁项的基础上获得的初步布局方案,给出了将候选方案进行筛选得到最终方案的算法CACULATE_EDIT_DISTANCE.实验结果表明:该方法可对无参数的初建车间进行有效的初步布局,不限制设备的使用概率,能实现多工件共享设备,多工件并发生产,且FMDM结果作为经典算法的输入可提高经典算法的收敛速度.  相似文献   

9.
Apriori算法在语音合成应用中的一种改进   总被引:1,自引:0,他引:1  
针对目前语音合成技术中提高语音合成自然度这一难点,研究了数据挖掘在语音合成中的应用.首先通过选取基频曲线中的最高音基频值(N1)和最低音基频值(N2)优化韵律参数,然后将其运用到关联规则对韵律参数进行规则提取的方法中,提出了优化韵律参数后的规则提取过程,并对原有的Apriori算法进行改进而获得更适合语音合成的HLApriori算法,通过该算法可以将原有Apriori算法得到的规则进一步细分,从而得到更多研究者感兴趣的规则.  相似文献   

10.
王娟 《科技信息》2011,(33):56-56,45
关联规则是数据挖掘的重要手段,它基于支持度、置信度等对规则进行筛选,生成有用的规则。关联规则反映了大量数据中项集之间的相互依存性和关联性。Apriori算法和FP-Growth算法是关联规则挖掘中的两个典型算法。本文阐述了这两种算法的基本思想、数据挖掘步骤,并讨论了它们的优缺点及差异。  相似文献   

11.
在海量数据的关联规则数据挖掘中,采用并行计算是非常必要的;针对当前的关联规则算法,运用并行算法的思想,结合云计算环境下的Hadoop架构,提出了Hadoop下的并行关联规则算法的设计,最后实验表明,该算法能处理节点失效,并且能实现节点负载均衡。  相似文献   

12.
分析了关联规则挖掘的各种算法,详尽分析和探讨了一种用于挖掘关联规则的矩阵算法并给出了矩阵算法实现过程.矩阵算法扫描数据库一次,然后生成事务矩阵,在矩阵上进行相关的数据挖掘操作.当数据库规模较大时,矩阵算法能够显著提高关联规则挖掘的效率.  相似文献   

13.
提出了一种基于云计算的模糊规则挖掘算法的入侵规则检测方法.以模糊集理论为基础,提出了在入侵关联规则挖掘中将特征属性模糊集作为单一属性来处理的模糊规则挖掘算法,有效地解决入侵规则中出现不相关规则和"尖锐边界"等问题.在云计算平台上进行算法的验证,利用云计算平台可进行大规模计算和数据处理的特点,得出该思想在入侵检测具有较好的应用效果和前景.  相似文献   

14.
为了解决云制造环境下分布式海量数据的分析处理、促进数据挖掘的开发集成和商业应用的问题,在云计算服务模式的基础上,提出了云制造服务模式、内容与技术基础,设计了数据挖掘服务模型,构建了基于云制造的数据挖掘服务模型体系架构,并给出了基于云制造的数据挖掘层次结构,从制造全生命周期的角度形成了云制造环境下的数据挖掘服务模式。  相似文献   

15.
Apriori算法是经典的数据挖掘算法之一,它根据置信度和支持度对产生的频繁集进行选择,找出强规则.传统的Apriori算法需要产生大量的侯选集和多次数据库的扫描,存储和通信的开销巨大.云计算环境可以解决存储问题,所以针对Mapreduce的编程框架,提出一种适用于此模式的新关联规则算法,解决传统Apriori算法时间和空间上的缺点,提高挖掘效率.  相似文献   

16.
廖孟柯  樊冰  李忠政  付林  舒楠 《科学技术与工程》2021,21(24):10381-10386
影响配电网设备提前退役的因素复杂多样,而且多种因素之间互相作用。为了筛选出影响设备提前退役的主要因素候选集,可以利用数据挖掘算法得到其中关联规则。其中,Apriori算法是最经典的挖掘关联规则的算法。但是传统的Apriori算法时间复杂度过大,计算效率不高。针对这一现状,提出一种基于三维矩阵的Apriori优化算法,通过建立三维矩阵以及简约数据库的方式,减少了传统算法中的计算冗余,挖掘出影响配电网设备提前退役的因素频繁项集。结果表明:改进算法能够得到配电网设备退役因素的关联规则并明显提高计算效率。  相似文献   

17.
Hadoop是一套开放的云计算平台,使用Map Reduce处理数据的分割与合并,简单的设置就可使用云计算的强大功能.但随之而来的是个人数据在没有任何保护的情况下随时可能遭受攻击,因此云平台上的个人信息安全问题就显得格外重要.本研究提出了一种具备安全数据传输的Hadoop云平台规则来增加云数据分割与合并的安全度.实验结果证明,本安全方案确实提高了云平台数据传输的安全性.  相似文献   

18.
针对传统决策树SPRINT(Scalable Parallelizable Induction of Decision Trees)算法不能处理海量地学数据挖掘的问题, 设计实现了基于G4ICCS(Geology Geography Geochemistry Geophysics Information Cloud Computing System)的决策树并行分类算法PSPRINT。该算法使用哈希表存储连续属性分割点两侧的数据记录, 为并行节点的分割提供依据, 在MapReduce架构下解决了海量地学数据挖掘问题。实验结果表明, 在模拟的云计算环境下, 决策树并行算法可以处理海量地学数据分类问题, 并获得较好的稳定性和较高的处理速度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号