CPU+GPU异构并行的矩阵转置算法研究 |
| |
作者姓名: | 肖汉 李彩林 李琦 周清雷 |
| |
作者单位: | 郑州师范学院信息科学与技术学院,河南 郑州 450044;郑州大学信息工程学院,河南 郑州 450001;山东理工大学建筑工程学院,山东 淄博,255000;郑州师范学院信息科学与技术学院,河南 郑州,450044;郑州大学信息工程学院,河南 郑州,450001 |
| |
基金项目: | 国家自然科学基金;国家自然科学基金;国家自然科学基金;国家自然科学基金;山东省自然科学基金 |
| |
摘 要: | 针对当前算法优化研究一般局限于单一硬件平台、很难实现在不同平台上高效运行的问题,利用图形处理器(GPU)提出了基于开放式计算语言(OpenCL)的矩阵转置并行算法.通过矩阵子块粗粒度并行、矩阵元素细粒度并行、工作项与数据的空间映射和本地存储器优化方法的应用,使矩阵转置算法在GPU计算平台上的性能提高了12倍.实验结果表明,与基于CPU的串行算法、基于开放多处理(OpenMP)并行算法和基于统一计算设备架构(CUDA)并行算法性能相比,矩阵转置并行算法在OpenCL架构下NVIDIA GPU计算平台上分别获得了12.26,2.23和1.50的加速比.该算法不仅性能高,而且实现了在不同计算平台间的性能移植.
|
关 键 词: | 矩阵转置 图形处理器 开放式计算语言 并行算法 |
本文献已被 CNKI 万方数据 等数据库收录! |
|