首页 | 本学科首页   官方微博 | 高级检索  
     检索      

CPU+GPU异构并行的矩阵转置算法研究
引用本文:肖汉,李彩林,李琦,周清雷.CPU+GPU异构并行的矩阵转置算法研究[J].东北师大学报(自然科学版),2019,51(4).
作者姓名:肖汉  李彩林  李琦  周清雷
作者单位:郑州师范学院信息科学与技术学院,河南 郑州 450044;郑州大学信息工程学院,河南 郑州 450001;山东理工大学建筑工程学院,山东 淄博,255000;郑州师范学院信息科学与技术学院,河南 郑州,450044;郑州大学信息工程学院,河南 郑州,450001
基金项目:国家自然科学基金;国家自然科学基金;国家自然科学基金;国家自然科学基金;山东省自然科学基金
摘    要:针对当前算法优化研究一般局限于单一硬件平台、很难实现在不同平台上高效运行的问题,利用图形处理器(GPU)提出了基于开放式计算语言(OpenCL)的矩阵转置并行算法.通过矩阵子块粗粒度并行、矩阵元素细粒度并行、工作项与数据的空间映射和本地存储器优化方法的应用,使矩阵转置算法在GPU计算平台上的性能提高了12倍.实验结果表明,与基于CPU的串行算法、基于开放多处理(OpenMP)并行算法和基于统一计算设备架构(CUDA)并行算法性能相比,矩阵转置并行算法在OpenCL架构下NVIDIA GPU计算平台上分别获得了12.26,2.23和1.50的加速比.该算法不仅性能高,而且实现了在不同计算平台间的性能移植.

关 键 词:矩阵转置  图形处理器  开放式计算语言  并行算法
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号