基于CUDA的大规模稀疏矩阵的PCG算法优化 |
| |
引用本文: | 郑经纬,安雪晖,黄绵松.基于CUDA的大规模稀疏矩阵的PCG算法优化[J].清华大学学报(自然科学版),2014(8):1006-1012. |
| |
作者姓名: | 郑经纬 安雪晖 黄绵松 |
| |
作者单位: | 清华大学水沙科学与水利水电工程国家重点实验室 |
| |
基金项目: | 国家“八六三”高技术项目(2012AA06A112);国家自然科学基金重点资助项目(51239006);水沙科学与水利水电工程国家重点实验室基金项目(2012-KY-02) |
| |
摘 要: | 为了实现大规模稀疏矩阵的高效求解,该文利用GPU(graphics processing unit)高带宽、低成本及强大的并行处理能力等优势,基于CUDA(compute unified device architecture)技术对采用CSR(compress spare row)格式存储的大规模稀疏矩阵进行了预处理共轭梯度(PCG)算法的求解优化。采用了存储器优化和数据流优化这2大并行优化策略,对稀疏矩阵与向量乘积和向量间内积与归约的GPU优化步骤进行了详细介绍。通过对实际的水工隧洞模型里的稀疏矩阵求解,得到在GTX580显卡上的计算效率是Intel i7CPU的13倍。该文提出的基于CUDA的PCG算法具备快速、高效求解大规模稀疏矩阵的能力。
|
关 键 词: | 预处理共轭梯度(preconditioned conjugate gradient PCG)算法 CUDA(compute unified device architecture)技术 稀疏矩阵 并行计算 优化 |
本文献已被 CNKI 等数据库收录! |
|