首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 781 毫秒
1.
现代计算机处理器个数的增加将高性能系统的计算速度推向更高的层次。基于SMP节点的集群系统占主导地位,这种跨节点的分布式内存系统与节点内共享内存系统的结合向开发人员提出了新的挑战。为了充分利用硬件的计算能力,计算机科学家已经提出了许多针对各种系统架构的并行编程模式。作为目前比较流行的层次化并行模式,MPI适合用于集群节点间的并行而OpenMP被用在节点内部进一步细粒化的并行。本文对这两种编程模式以及MPI+OpenMP混合编程模式进行研究,实现了将矩阵的乘法运算分别用纯MPI模式和MPI+OpenMP混合模式并行化。在基于Intel Xeon5650集群系统上,用不同规模大小的矩阵分别在单节点内和多节点的情况下测试了两种并行模式的性能。  相似文献   

2.
针对大规模三维颗粒两相流全尺度模拟并行计算问题,该文采用MPI+OpenMP混合编程模式,其中机群节点采用MPI并行计算,节点内部采用OpenMP进行细粒化的并行计算,并根据格子Boltzmann方法(LBM)颗粒两相流的特点进行OpenMP程序并行优化设计,提出了一种适用于大量颗粒的三维颗粒两相流LBM并行计算模型。以颗粒沉积问题为例,在集群计算机平台对并行算法的加速性能进行测试。计算结果表明:该算法具有良好的加速比及扩展性,并且其计算量具有颗粒数量不敏感的优点,适用于大规模多颗粒两相流问题的研究。  相似文献   

3.
基于三维相场模型,使用MPI+CUDA异构协同并行技术,在GPU集群上建立三维合金定向凝固的MultiGPU计算模型,实现了Al-Cu二元合金三维定向凝固的模拟.再现了Al-Cu二元合金三维定向凝固的过程,以及不同取向晶粒间的竞争生长现象.通过与传统CPU串行计算模型相比较,验证了Multi-GPU计算模型的计算效率和加速效果.实现了二元合金定向凝固的加速模拟计算,其加速比最大可达57.7.  相似文献   

4.
针对MPI、OPENMP并行程序各自存在的缺陷,将MPI与OPENMP结合起来,实现了MPI/OPENMP混合并行编程;通过实验对MPI、OPENMP并行程序及MPI/OPENMP混合并行编程进行了分析.实验结果表明:MPI/OPENMP混合并行编程可以大大减少通信量,其效率和加速比均优于纯MPI并行程序,克服了MPI并行程序中因粒子分布不均匀使负载不均衡而导致的程序性能下降的问题,使得可以利用集群中的更多结点来进行计算,缓解了MPI并行程序的通信延迟问题;同时,MPI/OPENMP混合并行编程克服了OPENMP并行程序依赖于单台计算机处理能力和存储空间的问题,大幅度提高了模拟规模.  相似文献   

5.
在对Ni-Cu二元合金进行三维模拟时采用了目前最有效的微观组织数值模拟方法—相场法.但是随着空间维数的增多,计算规模小、计算时间长、计算效率低成为突出的问题.为了解决以上问题,探讨基于MPI并行算法求解Ni-Cu二元合金自由生长的三维相场模型,分别采用MPI中点对点通信和组通信对串行程序进行并行设计,并对2种通信模式的加速比进行比较.同时采用不同的划分方法对并行程序中计算域进行划分并比较并行效率.结果表明:MPI并行方法可以使计算规模扩大到1 000个×1 000个×500个网格;在规模相同的情况下,组通信的加速比相对串行程序最高可以达到15.45倍,要高于点对点通信的10.06倍最高加速比;无论计算规模大小,点对点通信均适用,组通信由于数据缓存区的限制,不适用于计算规模较大的情况;面向行划分方式的计算效率和安全性均高于面向块划分方式.  相似文献   

6.
充分利用MPI(message passing interface)在并行环境下远高于单CPU的强大计算能力,探索基于MPI的并行系统结构,求解三维枝晶生长的高性能计算方法.通过多进程的并发执行,实现三维相场方程求解的并行计算,探讨MPI中点对点通信与集合通信在并行计算时数据传输的效率,讨论热噪声幅值Fu=0与Fu=10-3时三维枝晶生长过程.计算结果表明:基于MPI的并行算法可使模拟尺度达到1 000×1 000×1 000网格,大大提高可模拟尺度;采用集合通信模式比点对点通信模式具有更高的并行效率,更加适合大规模并行计算环境.  相似文献   

7.
基于MPI的二维泊松方程差分并行实现与测试   总被引:1,自引:0,他引:1  
消息传递是一种广泛应用于集群环境下的并行编程模型.针对简单二维Poisson方程的第一边值问题的典型差分格式,在MPI并行环境下,使用五点差分离散和雅可比迭代法实现了此类方程的并行求解.实际测试表明此类方程在一定问题规模下,其并行算法具有很好的加速比和并行效率.  相似文献   

8.
一种基于循环并行模式的多核优化方法   总被引:1,自引:0,他引:1  
从并行编程模式角度出发,分析了计算稠密型程序基于多核平台的优化方法,并结合循环并行模式与OpenMP、Intel parallel studio工具实现了对部分连接神经演化(PARCONE)模型的多核优化.优化结果表明,基于循环并行模式的设计方法是实现计算稠密型程序多核优化的一种快速有效方法.  相似文献   

9.
基于Intel第二代Xeon Phi代号为Knights Landing(KNL)众核处理器平台,利用MPI+OpenMP混合编程策略对并行矩量法(Method of Moments, MoM)进行了优化.利用OpenMP编程技术和KNL的计算资源,提高了CPU(Center Processing Unit)使用率;线程的引入,大幅度减少了矩阵填充过程中进程间的冗余积分;为发挥KNL的512位矢量宽度优势,通过向量化优化进一步提高了循环结构的执行效率;对计算密集型、CPU利用率高的矩阵求解过程,通过引入的OpenMP编程策略,减少了MPI(Message Passing Interface)通信时间,加速了求解.数值结果表明,通过在KNL众核处理器平台上的优化,可以极大地提升矩量法计算复杂电磁问题的效率.  相似文献   

10.
黄伟建  周伟  李珍 《科学技术与工程》2013,13(15):4207-4211,4222
在海洋水龄谱数值模拟过程中应用并行计算技术可以显著提高运算效率。将适用于分布式存储环境的消息传递接口(Message Passing Interface,MPI)与适用于共享存储环境的开放式多处理(Open Multi-Processing,OpenMP)两种并行计算技术相结合,提出了一种适用于海洋水龄谱数值模拟的混合并行计算模型。对比了其与传统的纯MPI方式在多核心(Chip Muti-processors)集群上的运算效率,并在此基础上研究了混合模型的系统资源利用情况以进一步了解其扩展能力。实验结果表明,MPI+OpenMP混合并行水龄谱模型具有更高的运算效率,同时系统资源消耗明显低于纯MPI方式。  相似文献   

11.
首先介绍了Linux集群、并行计算和MPI技术的基本概念与方法,深入研究了MPI并行编程环境和集群并行计算模式。然后对MPI进行了分析,给出了Linux环境下MPI编程环境的配置方法,在此基础上构建了一个基于Linux和MPI的集群系统。  相似文献   

12.
相控阵雷达仿真系统并行计算研究   总被引:1,自引:0,他引:1  
针对共享存储多处理器的集群环境,研究了减少相控阵雷达仿真系统运行时间的并行计算方法.根据相控阵雷达多个波束处理过程的相对独立性和信号处理仿真中多个距离单元采样点的计算特点,提出了一种粗粒度消息传递接口(MPI)分布式内存和细粒度OpenMP共享内存混合编程的两级并行方法.实验结果表明,并行计算使系统的仿真速度有较大提高.  相似文献   

13.
研究了集群环境下并行编程的两种模型——PVM和MPI,分析了基于PVM模型的PVM .CPPVM2种编程工具的发展情况、编程环境及各自特点;同时分析了基于MPI模型下提供开放资源的MPICH,LAM/MPI,MPIJava编程工具的发展情况、编程环境及各自特点、提出了集群编程环境将朝着面向对象的并行程序设计、广泛的异构环境支持、高性能计算程序设计的可视化等方向发展.  相似文献   

14.
PC集群的建立和MPI并行环境的实现与编程   总被引:3,自引:0,他引:3  
镇方雄 《咸宁学院学报》2004,24(3):41-42,53
基于商品化部件的高性能集群计算已逐渐成为一种未来主流的并行计算系统.本文介绍了一种基于WINDOWS和MPI并行编程环境的PC集群系统的建立,介绍了MH的特点以及MPI常用编程模式,并给出了具体的实例说明.  相似文献   

15.
虽然OpenMP是多核体系结构上的流行多线程并行编程模型,但是OpenMP编译器不检查数据相关性、访问冲突和其他可能导致程序错误执行的问题,这些问题传统上完全依赖用户使用锁机制来保证程序的正确性.锁机制的并行编程中存在并行程序效率和并行编程难度的矛盾.粒度大的锁机制编程容易,可应用的并行性挖掘比较差;粒度小的锁机制应用的并行性挖掘较好,可编程难度大,容易带来优先权倒置、死锁和锁护航等问题.通过动态二进制插桩技术,扩充OpenMP支持事务存储执行功能,可有效缓解OpenMP并行编程中并行程序效率和并行编程难度之间矛盾.  相似文献   

16.
将Decell算法与MPI并行系统进行有效结合,用于计算大规模矩阵的MP广义逆. 给出了算法设计方案;讨论了在MPI环境下的 程序执行; 并在PC机集群系统上实现.给出了关于并行加速比及效率的数值结果.  相似文献   

17.
采用LAM-MPI实现节点间粗粒度并行和OpenMP实现节点内细粒度并行这种混合编程方式为SMP机群提供了一种有效并行策略.讨论了LAM-MPI OpenMP混合编程环境的快速搭建以及多粒度混合并行编程方法,实现了分子动力学模拟问题的多粒度混合并行算法,并在搭建的8节点SMP机群环境中完成测试工作.  相似文献   

18.
随着多核处理器被广泛的应用于桌面系统,如何充分利用多核处理器的计算能力,挖掘应用程序的并行性,以充分发挥多核系统的强大计算能力,成为近几年国内外计算机领域研究的热点,多核系统并行程序设计也成为所有专业软件开发人员必须了解和掌握的一项技术.本文阐述了一种以OpenMP为基础的多核并行程序设计方法,研究并提出了两种符合多核系统并行程序设计特征的编程模式:条件同步模式和线程分组竞争模式.实验证明这些方法简单高效.  相似文献   

19.
针对汽车三维虚拟现实仿真系统在多核平台下的渲染效率和CPU利用率较低的这一问题,提出了一种基于OpenMP的多线程渲染优化方法。该方法采取了设置动态线程数量、策略调度以及渲染帧并行绘制等策略,对汽车三维虚拟现实仿真系统渲染过程中的初始化阶段、逻辑阶段以及渲染阶段进行并行优化。在多核平台上进行了实验,结果表明,该方法能有效地提高系统的渲染效率和CPU 利用率,改善CPU的负载均衡。  相似文献   

20.
目的设计并实现一种基于数据划分的矩阵乘法的并行算法,将划分的数据交给多个线程同时执行,充分挖掘计算机的性能。方法根据OpenMP并行编程的基本风格,并在Visual Studio2005上搭建能够实现并行编程的环境平台。结果并行算法所花费的时间较非并行算法短。结论通过与非并行矩阵乘法性能进行比较,验证该算法可以有效地利用多核处理器的优势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号