基于BP算法的片上学习CNN硬件加速器 |
| |
作者姓名: | 王飞 张多利 汪杨 王泽中 宋宇鲲 |
| |
作者单位: | 合肥工业大学电子科学与应用物理学院,安徽合肥 230601 |
| |
基金项目: | 国家自然科学基金;国家重点研发计划 |
| |
摘 要: | 为了适应便携式应用场合卷积神经网络(convolutional neural network,CNN)硬件加速器片上学习功能的需要,文章设计了一种多核并行运算的CNN硬件加速器,利用运算器内嵌缓存结构与运算过程分割和数据复用,减少运算器和存储器之间的数据交互,提高CNN运算的并行度,提升训练和推理过程的效率.该架构包含...
|
关 键 词: | 卷积神经网络(CNN)加速器 片上学习 现场可编程门阵列(FPGA) Toeplitz矩阵 |
本文献已被 CNKI 万方数据 等数据库收录! |
|