首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 281 毫秒
1.
针对大规模三维颗粒两相流全尺度模拟并行计算问题,该文采用MPI+OpenMP混合编程模式,其中机群节点采用MPI并行计算,节点内部采用OpenMP进行细粒化的并行计算,并根据格子Boltzmann方法(LBM)颗粒两相流的特点进行OpenMP程序并行优化设计,提出了一种适用于大量颗粒的三维颗粒两相流LBM并行计算模型。以颗粒沉积问题为例,在集群计算机平台对并行算法的加速性能进行测试。计算结果表明:该算法具有良好的加速比及扩展性,并且其计算量具有颗粒数量不敏感的优点,适用于大规模多颗粒两相流问题的研究。  相似文献   

2.
针对二元合金三维相场模型模拟研究中存在的计算区域小、计算效率低,难以满足二元合金大规模模拟的需求,提出基于MPI+OpenMP混合编程模式的并行方法.在相同计算规模下对MPI和OpenMP并行技术的优缺点进行分析.在计算机集群环境下对MPI+OpenMP混合编程模式和纯MPI并行方法的并行效率进行对比和分析.结果证明:基于MPI+OpenMP混合编程模式可以有效地扩大二元合金三维相场模型的计算规模;在多核集群环境下,相对于纯MPI并行方法,MPI+OpenMP混合编程可以更加有效地利用多核集群的多层次结构,取得更高的加速比和计算效率.  相似文献   

3.
相控阵雷达仿真系统并行计算研究   总被引:1,自引:0,他引:1  
针对共享存储多处理器的集群环境,研究了减少相控阵雷达仿真系统运行时间的并行计算方法.根据相控阵雷达多个波束处理过程的相对独立性和信号处理仿真中多个距离单元采样点的计算特点,提出了一种粗粒度消息传递接口(MPI)分布式内存和细粒度OpenMP共享内存混合编程的两级并行方法.实验结果表明,并行计算使系统的仿真速度有较大提高.  相似文献   

4.
考虑纯无网格并行计算在传热方程数值模拟中的应用. 首先将Taylor展开式保留到三阶导数, 拓展应用纯无网格有限点集法(FPM), 对三维热传导方程进行求解以提高数值精度; 其次引入MPI并行计算技术, 通过循环语句的并行, 采用多个CPU计算以提高计算效率, 得到一种针对三维热传导问题模拟的可靠、 高效性纯网格并行FPM算法. 在数值算例中, 先对不同区域上带不同边值条件的传热问题进行求解, 并与解析解对比, 分析给出算法的计算效率和误差; 然后用给出的并行算法对功能梯度材料中温度随时间演化过程进行模拟预测, 并与其他数值结果做比较, 以验证数值预测的可靠性.  相似文献   

5.
考虑纯无网格并行计算在传热方程数值模拟中的应用. 首先将Taylor展开式保留到三阶导数, 拓展应用纯无网格有限点集法(FPM), 对三维热传导方程进行求解以提高数值精度; 其次引入MPI并行计算技术, 通过循环语句的并行, 采用多个CPU计算以提高计算效率, 得到一种针对三维热传导问题模拟的可靠、 高效性纯网格并行FPM算法. 在数值算例中, 先对不同区域上带不同边值条件的传热问题进行求解, 并与解析解对比, 分析给出算法的计算效率和误差; 然后用给出的并行算法对功能梯度材料中温度随时间演化过程进行模拟预测, 并与其他数值结果做比较, 以验证数值预测的可靠性.  相似文献   

6.
现代计算机处理器个数的增加将高性能系统的计算速度推向更高的层次。基于SMP节点的集群系统占主导地位,这种跨节点的分布式内存系统与节点内共享内存系统的结合向开发人员提出了新的挑战。为了充分利用硬件的计算能力,计算机科学家已经提出了许多针对各种系统架构的并行编程模式。作为目前比较流行的层次化并行模式,MPI适合用于集群节点间的并行而OpenMP被用在节点内部进一步细粒化的并行。本文对这两种编程模式以及MPI+OpenMP混合编程模式进行研究,实现了将矩阵的乘法运算分别用纯MPI模式和MPI+OpenMP混合模式并行化。在基于Intel Xeon5650集群系统上,用不同规模大小的矩阵分别在单节点内和多节点的情况下测试了两种并行模式的性能。  相似文献   

7.
为了提高机载设备振动环境实测数据处理效率,提出了一种并行化数据处理和振动环境谱编制方法。在SMP(symmetrical multi-processing)集群系统的多级体系结构下,以Welch(改进周期图法)算法为基础,进行了振动数据处理模型的并行化分析,对于并行化过程中存在的并行I/O、负载平衡等关键问题进行了讨论,提出了相应的解决方案。最终选择基于MPI/Open MP混合方式实现了算法。在搭建的集群环境下测试表明,12核参与运算的条件下,最高加速比可以达到7.4,有效提高了运算效率。  相似文献   

8.
充分利用MPI(message passing interface)在并行环境下远高于单CPU的强大计算能力,探索基于MPI的并行系统结构,求解三维枝晶生长的高性能计算方法.通过多进程的并发执行,实现三维相场方程求解的并行计算,探讨MPI中点对点通信与集合通信在并行计算时数据传输的效率,讨论热噪声幅值Fu=0与Fu=10-3时三维枝晶生长过程.计算结果表明:基于MPI的并行算法可使模拟尺度达到1 000×1 000×1 000网格,大大提高可模拟尺度;采用集合通信模式比点对点通信模式具有更高的并行效率,更加适合大规模并行计算环境.  相似文献   

9.
在裂缝性油藏数值模拟中,引入非结构四边形网格系统是目前高精度数值模拟研究的热点,它能对复杂油藏边界、交叉裂缝、多条裂缝、多方向分布裂缝、复杂分支结构井等条件下任意连通区域进行网格剖分,相对其他非结构网格,它需要的网格数量少,且精度更高。建立连续介质模型和离散裂缝模型相结合的混合渗流模型并数值离散求解发现,非结构四边形网格的引入导致数值模拟计算效率严重下降。针对此问题,提出了3种解决方案:改进Paving算法的裂缝末端形态变形法、二维和三维网格编号重新排序方法和MPI并行计算方法,计算效率平均提高70%。  相似文献   

10.
基于Intel第二代Xeon Phi代号为Knights Landing(KNL)众核处理器平台,利用MPI+OpenMP混合编程策略对并行矩量法(Method of Moments, MoM)进行了优化.利用OpenMP编程技术和KNL的计算资源,提高了CPU(Center Processing Unit)使用率;线程的引入,大幅度减少了矩阵填充过程中进程间的冗余积分;为发挥KNL的512位矢量宽度优势,通过向量化优化进一步提高了循环结构的执行效率;对计算密集型、CPU利用率高的矩阵求解过程,通过引入的OpenMP编程策略,减少了MPI(Message Passing Interface)通信时间,加速了求解.数值结果表明,通过在KNL众核处理器平台上的优化,可以极大地提升矩量法计算复杂电磁问题的效率.  相似文献   

11.
采用LAM-MPI实现节点间粗粒度并行和OpenMP实现节点内细粒度并行这种混合编程方式为SMP机群提供了一种有效并行策略.讨论了LAM-MPI OpenMP混合编程环境的快速搭建以及多粒度混合并行编程方法,实现了分子动力学模拟问题的多粒度混合并行算法,并在搭建的8节点SMP机群环境中完成测试工作.  相似文献   

12.
共享内存并行编程最优同步方法的研究   总被引:1,自引:1,他引:0  
共享内存并行编程是并行编程开发与研究的标准之一,为了保证程序运行的准确性和线程执行的高效率,对共享内存同步机制的研究具有重要意义。互斥锁与事件同步是Open MP标准中的混合同步机制,而斯坦福大学的Baek等人扩展Open MP提出的面向事务存储的Open TM应用编程接口,事务内存同步是其突出特点。通过研究发现混合同步存在部分互斥锁同步会严重消耗系统空间资源、线程资源利用率有待提高等问题,而事务同步忽视不可恢复行为的影响。因此,提出一种基于共享内存的最优同步方法,即优化后的混合同步和事务内存同步的结合体,实验论证此优化方法的可行性,程序运行更加高效。  相似文献   

13.
The Kinetic Monte Carlo(KMC) is one of the commonly used methods for simulating radiation damage of materials. Our team develops a parallel KMC software named Crystal-KMC, which supports the Embedded Atom Method(EAM) potential energy and utilizes the Message Passing Interface(MPI) technology to simulate the vacancy transition of the Copper(Cu) element under neutron radiation. To make better use of the computing power of modern supercomputers, we develop the parallel efficiency optimization model for the Crystal-KMC on Tianhe-2, to achieve a larger simulation of the damage process of materials under irradiation environment. Firstly, we analyze the performance bottleneck of the Crystal-KMC software and use the MIC offload statement to implement the operation of key modules of the software on the MIC coprocessor. We use Open MP to develop parallel optimization for the Crystal-KMC, combined with existing MPI inter-process communication optimization, finally achieving hybrid parallel optimization. The experimental results show that in the single-node CPU and MIC collaborative parallel mode, the speedup of the calculation hotspot reaches 30.1, and the speedup of the overall software reaches 7.43.  相似文献   

14.
以Greville算法及行主元的Gauss消元法为基础,给出计算Moore-Penrose广义逆A的并行方法,并对算法的复杂度(O(mn2/p))、并行计算成本(O(mn2))、并行加速比及效率进行分析.讨论如何利用MPI界面进行程序设计,并在PC机集群系统上实现A+的并行计算.最后列出一些数值结果.  相似文献   

15.
探索了一种基于Windows系统平台的、用于实现高性能计算的MPI并行环境.采用MPI最新版本MPICH2-1.0.6作为并行计算的支撑环境,通过编制的三个具有代表性的MPI并行计算程序,并在以100M bps交换式局域网作为互连的机群上和具有双核处理器的PC机上分别进行了并行效率的实际测试,得到了预期结果,并做了相应分析.  相似文献   

16.
探索了一种基于Windows系统平台的、用于实现高性能计算的MPI并行环境.采用MPI最新版本MPICH2-1.0.6作为并行计算的支撑环境,通过编制的三个具有代表性的MPI并行计算程序,并在以100M bps交换式局域网作为互连的机群上和具有双核处理器的PC机上分别进行了并行效率的实际测试,得到了预期结果,并做了相应分析.  相似文献   

17.
用传统的串行算法进行矩阵相乘运算会受到矩阵规模、单机的CPU主频、内存大小和存储器空间等方面的限制.而使用并行算法是解决上述限制的最有效途径.为此,在集群计算环境下,使用SPMD计算模型和基于MPI消息传递技术设计实现了矩阵相乘的并行算法.实验表明,此并行算法在一定矩阵规模下具有较好的加速比和并行效率.  相似文献   

18.
研究在共享内存式计算机架构下,基于OpenMP及矢量算术逻辑单元(VALU)硬件加速的表面积分方程矩量法的混合并行求解技术. 讨论了矩量法并行程序设计中的关键问题,并分析了影响并行计算的主要因素. 针对一些典型散射目标,给出了由混合并行程序得到的雷达散射截面数值结果. 通过对计算数据的对比分析,指出负载平衡及内存读取连续性是影响混合并行效率的关键问题所在.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号