PS-Hybrid: 面向大规模推荐模型训练的混合通信框架 |
| |
作者姓名: | 苗旭鹏 张敏旭 邵蓥侠 崔斌 |
| |
作者单位: | 1. 北京大学 信息科学技术学院, 北京 100871;2. 北京邮电大学 计算机学院, 北京 100876 |
| |
基金项目: | 国家重点研发计划;国家自然科学基金;北京大学-腾讯协同创新实验室项目 |
| |
摘 要: | 传统的分布式深度学习训练系统大多基于参数服务器和全局规约通信框架,缺陷日益显著:参数量大,基于全局规约的去中心化通信架构由于无法存储全量模型而无法使用;通信量大,基于参数服务器的中心化通信架构面临着严重的通信瓶颈。为了解决以上问题,该文提出了面向大规模深度学习推荐模型的混合通信训练框架PS-Hybrid,分离了嵌入层参数和其他参数的通信逻辑,实现了PS-Hybrid原型系统。实验结果证明了所提出的混合通信方案能够比纯参数服务器方案取得更好的性能,在16个计算节点下比TensorFlow-PS加速48%。
|
关 键 词: | 推荐模型 分布式深度学习 参数服务器 全局规约 |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《清华大学学报(自然科学版)》浏览原始摘要信息 |
|
点击此处可从《清华大学学报(自然科学版)》下载全文 |
|