首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于CUDA流技术的深度学习系统优化
引用本文:蒋文斌,刘湃,陈雨浩,张杨松.基于CUDA流技术的深度学习系统优化[J].华中科技大学学报(自然科学版),2020,48(7):107-111.
作者姓名:蒋文斌  刘湃  陈雨浩  张杨松
作者单位:华中科技大学计算机科学与技术学院,湖北武汉430074;华中科技大学大数据技术与系统国家工程研究中心,湖北武汉430074;华中科技大学服务计算技术与系统教育部重点实验室,湖北武汉430074
摘    要:为了在不损失模型准确率的同时优化Caffe深度学习框架的训练速度,提出了一种面向Caffe并基于计算统一设备架构(CUDA)流技术的深度学习系统优化方法,以便充分利用GPU资源,提高计算的并行度.在Caffe网络的各层使用异步CUDA流,使其运行在独立线程以并行执行GPU计算任务;同时将批处理块划分成多个数据片,使用调度算法在前向传播和反向传播过程中以流水线形式进行处理.在数据集MNIST和CIFAR-10上的实验结果表明:优化后的系统在训练速度上有明显提升,同时准确率基本无损失.

关 键 词:深度学习  计算统一设备架构(CUDA)流  训练速度  调度算法  准确率
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号