首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于CUDA的大规模稀疏矩阵的PCG算法优化
引用本文:郑经纬,安雪晖,黄绵松.基于CUDA的大规模稀疏矩阵的PCG算法优化[J].清华大学学报(自然科学版),2014(8):1006-1012.
作者姓名:郑经纬  安雪晖  黄绵松
作者单位:清华大学水沙科学与水利水电工程国家重点实验室
基金项目:国家“八六三”高技术项目(2012AA06A112);国家自然科学基金重点资助项目(51239006);水沙科学与水利水电工程国家重点实验室基金项目(2012-KY-02)
摘    要:为了实现大规模稀疏矩阵的高效求解,该文利用GPU(graphics processing unit)高带宽、低成本及强大的并行处理能力等优势,基于CUDA(compute unified device architecture)技术对采用CSR(compress spare row)格式存储的大规模稀疏矩阵进行了预处理共轭梯度(PCG)算法的求解优化。采用了存储器优化和数据流优化这2大并行优化策略,对稀疏矩阵与向量乘积和向量间内积与归约的GPU优化步骤进行了详细介绍。通过对实际的水工隧洞模型里的稀疏矩阵求解,得到在GTX580显卡上的计算效率是Intel i7CPU的13倍。该文提出的基于CUDA的PCG算法具备快速、高效求解大规模稀疏矩阵的能力。

关 键 词:预处理共轭梯度(preconditioned  conjugate  gradient  PCG)算法  CUDA(compute  unified  device  architecture)技术  稀疏矩阵  并行计算  优化
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号