基于CUDA流技术的深度学习系统优化 |
| |
引用本文: | 蒋文斌,刘湃,陈雨浩,张杨松.基于CUDA流技术的深度学习系统优化[J].华中科技大学学报(自然科学版),2020,48(7):107-111. |
| |
作者姓名: | 蒋文斌 刘湃 陈雨浩 张杨松 |
| |
作者单位: | 华中科技大学计算机科学与技术学院,湖北武汉430074;华中科技大学大数据技术与系统国家工程研究中心,湖北武汉430074;华中科技大学服务计算技术与系统教育部重点实验室,湖北武汉430074 |
| |
摘 要: | 为了在不损失模型准确率的同时优化Caffe深度学习框架的训练速度,提出了一种面向Caffe并基于计算统一设备架构(CUDA)流技术的深度学习系统优化方法,以便充分利用GPU资源,提高计算的并行度.在Caffe网络的各层使用异步CUDA流,使其运行在独立线程以并行执行GPU计算任务;同时将批处理块划分成多个数据片,使用调度算法在前向传播和反向传播过程中以流水线形式进行处理.在数据集MNIST和CIFAR-10上的实验结果表明:优化后的系统在训练速度上有明显提升,同时准确率基本无损失.
|
关 键 词: | 深度学习 计算统一设备架构(CUDA)流 训练速度 调度算法 准确率 |
本文献已被 CNKI 万方数据 等数据库收录! |
|