耦合Nvidia/AMD两类GPU的格子玻尔兹曼模拟 Lattice Boltzmann simulation on Nvidia and AMD GPUs期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

耦合Nvidia/AMD两类GPU的格子玻尔兹曼模拟

引用本文：	李博,李曦鹏,张云,陈飞国,徐骥,王小伟,何险峰,王健,葛蔚,李静海.耦合Nvidia/AMD两类GPU的格子玻尔兹曼模拟[J].科学通报,2009,54(20):3177-3184.

作者姓名：	李博李曦鹏张云陈飞国徐骥王小伟何险峰王健葛蔚李静海

作者单位：	中国科学院过程工程研究所, 多相复杂系统国家重点实验室, 北京 100190; 中国科学院研究生院, 北京 100049

基金项目：	国家重大科研装备研制项目(编号: ZDYZ2008-2)、国家自然科学基金(批准号: 20221603, 20490201)和中国科学院知识创新工程项目(编号: KGCX2-YW-124)资助

摘要：	利用图形处理单元(graphic processing unit, GPU)进行通用计算近年来得到关注, Nvidia和AMD公司已推出了各自的开发环境CUDA和ASC. 很多计算在GPU上的速度远高于目前的CPU. 格子玻尔兹曼方法(lattice Boltzmann method, LBM)作为一种网格上的粒子方法, 对流动模拟具有良好的内在并行性, 非常适合利用GPU进行大规模并行计算. 本文提出了一种耦合Nvidia和AMD的两类GPU完成LBM凹槽流模拟的算法, 对于两类GPU, 在LBM的D2Q9模型下分别设计了相应的算法和程序, 之后利用消息传递接口(message passing interface, MPI)协议通过多程序多数据流(multi-program multi-data, MPMD)模式使其能够联合计算, 以充分发挥混合GPU集群系统的性能. 通过GPU和CPU程序结果的比较, 证实了GPU计算的正确性和所能带来的显著的加速比, 为建设通用大规模GPU并行计算平台提供了重要参考.
关键词：	GPGPU 格子波尔兹曼 Nvidia AMD 多程序多数据流联合计算
收稿时间：	2009-06-24
Lattice Boltzmann simulation on Nvidia and AMD GPUs

LI Bo,LI Xi-Feng,ZHANG Yun,CHEN Fei-Guo,XU Ji,WANG Xiao-Wei,HE Jian-Feng,WANG Jian,GE Wei,LI Jing-Hai.Lattice Boltzmann simulation on Nvidia and AMD GPUs[J].Chinese Science Bulletin,2009,54(20):3177-3184.

Authors:	LI Bo LI Xi-Feng ZHANG Yun CHEN Fei-Guo XU Ji WANG Xiao-Wei HE Jian-Feng WANG Jian GE Wei LI Jing-Hai

Institution:	1 State Key Laboratory of Multiphase Complex Systems, Institute of Process Engineering, Chinese Academy of Sciences, Beijing 100190, China; 2 Graduate University of Chinese Academy of Sciences, Beijing 100049, China

Abstract:	General purpose computing on graphic processing units (GPUs) has received great attention re-cently. Both Nvidia and AMD have announced their own SDK, CUDA and ASC, respectively. Com-pared with CPUs, many applications can achieve high speed-up on GPUs. As a mesh-based particle method for flow simulation, lattice Boltzmann method (LBM) has perfect intrinsic parallelism that is very suitable for large-scale parallel computing. In this article, we put forward an algorithm for LB simulation of flow in grooved channel using the D2Q9 model, running on both Nvidia and AMD GPUs in the multi-program multi-data (MPMD) mode through message passing interface (MPI). The capability of hybrid GPU clusters can thus be fully utilized. The correctness and performance of the computation is analyzed through comparison with corresponding CPU implementation and significant speed-up of the GPU implementation has been demonstrated. The results provide valuable references to the establishment of GPU-based high performance computing (HPC) systems.

Keywords:	GPGPU lattice Boltzmann Nvidia AMD multi-program multi-data coupling computing

	点击此处可从《科学通报》浏览原始摘要信息
	点击此处可从《科学通报》下载免费的PDF全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏