一种基于可编程逻辑器件的卷积神经网络协处理器设计 |
| |
引用本文: | 杨一晨,张国和,梁峰,何平,吴斌,高震霆.一种基于可编程逻辑器件的卷积神经网络协处理器设计[J].西安交通大学学报,2018(7). |
| |
作者姓名: | 杨一晨 张国和 梁峰 何平 吴斌 高震霆 |
| |
作者单位: | 西安交通大学电子与信息工程学院 |
| |
摘 要: | 针对大数据时代下深层次大规模深度学习网络模型在预测中对运算资源和访存带宽需求指数的增长,以及业界传统CPU+GPU解决方案难以应用于日益普遍的移动嵌入式应用场景等问题,提出了一个基于可编程逻辑器件(FPGA)的卷积神经网络协处理器异构加速设计方案。该方案采用通用模型设计思想,具有可编程性,并且能够兼容多种网路模型从而实现硬件加速;方案具有可扩展性,可在硬件资源允许的范围内进行多核扩展以获得性能翻倍提升。利用硬件的并行性,数据的复用性设计的卷积运算模块提高了硬件资源利用率及运算效率;合理配置的多级缓存结构降低了协处理器对外部存储器读写频率和带宽的占用率,提升了模块内部的通信效能。在XILINX VC707评估板的上板进行实验,结果表明,MNIST-LeNet测试集的准确率高达99%,CIFAR-10可实现80%,浮点运算速度为5.511×1010 s-1,综合性能约两倍于Intel Xeno E5-2640V4服务器通用处理器,达到同期FPGA解决方案的主流水平。
|
本文献已被 CNKI 等数据库收录! |
|