首页 | 本学科首页   官方微博 | 高级检索  
     检索      

SDD 1改进算法在Hive中应用
引用本文:王宝进,吴淑跃,薛娟.SDD 1改进算法在Hive中应用[J].湘潭大学自然科学学报,2014(4):77-82.
作者姓名:王宝进  吴淑跃  薛娟
作者单位:江苏大学计算机科学与通讯工程学院;江苏省交通技师学院电气与信息工程系
基金项目:国家自然科学基金项目(61072002)
摘    要:针对Hive在处理连接查询时所存在的执行时间长和带宽资源消耗大等问题,提出了一种基于数据预处理和双半连接的SDD-1改进算法.首先,引入预处理技术,在各分布节点对原始数据进行归并排序,以减少汇聚节点的数据映射次数,加快数据处理执行速度;其次,采用基于行和列的双半连接技术,进一步缩减在不同节点间的数据传输量,减少带宽资源消耗.仿真实验表明,相比原始的Hive连接算法,改进算法在元组数达到5 000和8 000时,可使查询速度提升10%,有效缩短查询的处理和响应时间,该改进算法可方便地应用到其他云计算平台上.

关 键 词:数据预处理  双半连接  SDD-1改进算法
本文献已被 CNKI 等数据库收录!
点击此处可从《湘潭大学自然科学学报》浏览原始摘要信息
点击此处可从《湘潭大学自然科学学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号