首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种面向不可靠网络的快速RDMA通信方法
引用本文:王绍刚,徐炜遐,吴丹,庞征斌,夏军.一种面向不可靠网络的快速RDMA通信方法[J].湖南大学学报(自然科学版),2015,42(8):100-107.
作者姓名:王绍刚  徐炜遐  吴丹  庞征斌  夏军
作者单位:(国防科学技术大学 计算机学院, 湖南 长沙410073)
摘    要:大数据量的远程内存访问(RDMA)传输是并行计算机中最基本的通信模式之一,对系统整体性能的影响很大.随着并行计算机系统的规模扩大,系统的容错性设计面临着很大的挑战,互连网络具有链路不可靠、自适应路由等特点,如何面向不可靠网络实现可靠的端到端RDMA传输是并行系统体系结构设计的一大难题.提出一种面向不可靠网络下的快速RDMA传输方法,方法能够在节点控制器芯片上高效实现,对上层驱动软件和应用提供可靠的端到端RDMA传输服务.与传统的建立连接的方法相比,方法的硬件设计复杂度大大降低;方法另一优点是实现了按需重传,避免了传统方法中一次RDMA传输出现错误时,需要重传整个RDMA数据的开销,在相同的错误概率下,新方法的传输效率得到了很大的提升.

关 键 词:远程内存访问  RDMA  MPI  滑动窗口

A Fast RDMA Offload Method for Unreliable Interconnection Networks
Institution:(College of Computer, National Univ of Defense Technology, Changsha, Hunan410073, China)
Abstract:Large data RDMA (Remote Data Memory Access) transport is the most commonly used parallel communication mode for parallel computers, which has great impact on the whole system performance. As the system size increases, the fault-tolerate architecture design faces new challenges. The interconnection network usually uses the adaptive routing mode and becomes more unreliable. This paper proposed a fast RDMA offload method for unreliable interconnection networks, which can be efficiently implemented on the NIC hardware and provides reliable RDMA communication for upper driver and programs. Compared with the traditional approaches, the hardware overhead is greatly reduced. Another benefit is that it can partially retransmit the fault data, which greatly reduces the whole RDMA delay. Simulation results show that the RDMA delay is greatly reduced, compared with the traditional methods.
Keywords:remote data memory access  RDMA  MPI  sliding window approach
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《湖南大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《湖南大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号