基于Map/Reduce的分布式数据排序算法分析 |
| |
作者单位: | ;1.华东师范大学数据科学与工程研究院 |
| |
摘 要: | 为了解决大规模数据的存储与计算,近年来分布式系统得到了大量的应用.如何在分布式系统中对大规模数据集进行排序是影响许多应用性能的基础问题,其中不仅涉及每个节点上排序算法的选择,更重要的是设计协调各节点的分布式算法.本文总结了分布式系统中常用的分布式排序算法,对每种算法的执行流程、代价模型和适用场景进行了分析,并通过实验对分析结果进行了验证.本文的工作可以帮助开发人员选择和优化分布式环境下大规模数据排序的算法.
|
关 键 词: | 分布式系统 排序算法 代价模型 |
Sorting algorithm analysis of distributed data based on Map/Reduce |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 CNKI 等数据库收录! |
|