首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
采用LAM-MPI实现节点间粗粒度并行和OpenMP实现节点内细粒度并行这种混合编程方式为SMP机群提供了一种有效并行策略.讨论了LAM-MPI OpenMP混合编程环境的快速搭建以及多粒度混合并行编程方法,实现了分子动力学模拟问题的多粒度混合并行算法,并在搭建的8节点SMP机群环境中完成测试工作.  相似文献   

2.
并行程序可以充分发掘硬件计算能力并提高程序性能,但是在多核集群环境中编写并行程序十分复杂。该文提出了面向多核集群的并行编程框架,Horde。Horde提供了一组简单易用的消息传递接口和事件驱动(event-driven)编程模型,用以帮助程序员表达算法逻辑中潜在的并行性,将计算分解与底层硬件结构去耦合,从而简化编写并行程序的复杂度,灵活地在不同的底层结构的集群上进行映射并能保持良好的性能。此外,Horde也提供了有效的任务对象迁移机制,可以实现动态负载均衡与在线容错。在128核集群上的实验表明:Horde可以有效执行并行程序,并且可以实现高效的任务对象迁移。  相似文献   

3.
本文是对多核程序设计的一种探索,在OpenMP模型下以赫夫曼算法为基础设计并行压缩程序.首先对传统的串行程序进行分析,使应用程序开发人员了解程序行为、发现性能瓶颈、明确优化方向.再用OpenMP的基本结构进行并行程序的设计之后,借助开发工具对并行程序进行优化和调试,得到改进方案.然后在双核处理器上分别运行并行程序与串行程序,将两者进行性能上的比较,实验结果证明性能得到很大程度地提高。  相似文献   

4.
关于Open MP:一个并行编程接口   总被引:1,自引:0,他引:1  
OpenMP是一个公认的共享存储系统的并行编程接口.它由一些语言指导(directives)及库函数组成,并建立在Fortran或者C、C++语言的基础上.优点是简单、通用,有利于快速开发并行程序.介绍了它的发展历史、执行模型以及它的三个组成部份,即语言指导(一些在Fortran、C或C++基础上增加的注释语句)、运行库函数(共有10个与执行环境有关的运行库函数)和环境变量(设置该OpenMP执行时所需的线程总数).文中还提供了已公开发布的OpenMP应用程序的情况,并讨论了它将来的发展趋势.OpenMP的推广,还需要解决它的可扩展性问题.  相似文献   

5.
为了快速求解10000个粒子的湍流碰撞聚合问题,采用OpenMP对Smoluchowski方程的FORTRAN求解程序进行了并行处理.数值结果表明:在不改变串行程序结构的情况下,仅对循环体部分进行并行处理,并行效率可高达80%,且串行程序与并行程序的计算结果完全吻合.对于大计算量循环体的并行计算,采用全部处理器进行并行计算时耗时最小.但是对于小计算量循环体的并行计算,采用全部处理器进行并行计算时耗时不一定最小.  相似文献   

6.
摘要:
针对当前工艺条件下多核处理器存在程序并行性不足的问题,设计了一种采用数据驱动机制、支持函数语言风格编程的多核处理器,包括通用处理器核、数据驱动模块和片内路由器.其中:通用处理器核用于执行常规程序;数据驱动模块用于检测数据的完备性;片内路由器则可提供处理器核之间及簇之间的通信.实验结果表明,所设计的多核处理器能够支持C语言“函数式语言”风格的编程模板.每个C代码段执行纯函数的操作,消除了函数间的共享变量,使得并行编程的复杂度有所降低.同时,所采用的数据驱动机制没有执行顺序的严格限制,充分挖掘了算法潜在的并行性.经测试,数据驱动多核处理器的加速比随着计算资源的增加而增大,从而验证了数据流计算机的加速倍数随处理器数目增加而线性增长的结论.
关键词:
数据驱动; 并行编程模型; 数据流机; 多核处理器
中图分类号: TP 338
文献标志码: A  相似文献   

7.
针对MPI、OPENMP并行程序各自存在的缺陷,将MPI与OPENMP结合起来,实现了MPI/OPENMP混合并行编程;通过实验对MPI、OPENMP并行程序及MPI/OPENMP混合并行编程进行了分析.实验结果表明:MPI/OPENMP混合并行编程可以大大减少通信量,其效率和加速比均优于纯MPI并行程序,克服了MPI并行程序中因粒子分布不均匀使负载不均衡而导致的程序性能下降的问题,使得可以利用集群中的更多结点来进行计算,缓解了MPI并行程序的通信延迟问题;同时,MPI/OPENMP混合并行编程克服了OPENMP并行程序依赖于单台计算机处理能力和存储空间的问题,大幅度提高了模拟规模.  相似文献   

8.
分布式并行计算是提高计算机性能常用的方法,但针对不同需求,并行程序的设计并没有统一的模型与方法,使得并行程序的编写完全依靠开发人员的经验。Google公司提出的分布式并行编程模型MapReduce能够完成特定类型的并行程序的开发与运行。使用哈希表对MapReduce分布式并行编程模型进行优化,减少中间结果中的碎片,并省略Combiner中间函数的调用,减少传输负载,提升运行效率,同时兼顾了Map函数与Reduce函数接口的属性,保持了MapReduce模型的并行性特点。  相似文献   

9.
针对二元合金三维相场模型模拟研究中存在的计算区域小、计算效率低,难以满足二元合金大规模模拟的需求,提出基于MPI+OpenMP混合编程模式的并行方法.在相同计算规模下对MPI和OpenMP并行技术的优缺点进行分析.在计算机集群环境下对MPI+OpenMP混合编程模式和纯MPI并行方法的并行效率进行对比和分析.结果证明:基于MPI+OpenMP混合编程模式可以有效地扩大二元合金三维相场模型的计算规模;在多核集群环境下,相对于纯MPI并行方法,MPI+OpenMP混合编程可以更加有效地利用多核集群的多层次结构,取得更高的加速比和计算效率.  相似文献   

10.
基于工作站或高性能微机群组的并行计算,是并行计算领域研究的热点。常见的并行环境有MPI等,但它们编程复杂,并行程序的可移植性差。该文介绍了一种有效的并行计算模型BSP,它的并行编程容易,性能可预测,程序的可移植性好。  相似文献   

11.
Analysis of Factors Affecting Execution Performance of OpenMP Programs   总被引:3,自引:0,他引:3  
OpenMP is able to develop multithreaded programs with lower cost as a promising way to quickly parallelize a great number of serial programs. However, there are many difficulties when developing OpenMP multithreaded programs. Most importantly, the performance of OpenMP programs cannot be guaranteed, which has greatly affected the application of OpenMP. This paper examines several factors that affect the execution performance of OpenMP programs, including loop transformation, scheduling strategy, the number of threads, and nested parallelism. The results show that one of the key reasons for performance degradation is load imbalance, which can be corrected by reasonable use of these key factors to improve the execution performance of OpenMP programs.  相似文献   

12.
共享内存并行编程最优同步方法的研究   总被引:1,自引:1,他引:0  
共享内存并行编程是并行编程开发与研究的标准之一,为了保证程序运行的准确性和线程执行的高效率,对共享内存同步机制的研究具有重要意义。互斥锁与事件同步是Open MP标准中的混合同步机制,而斯坦福大学的Baek等人扩展Open MP提出的面向事务存储的Open TM应用编程接口,事务内存同步是其突出特点。通过研究发现混合同步存在部分互斥锁同步会严重消耗系统空间资源、线程资源利用率有待提高等问题,而事务同步忽视不可恢复行为的影响。因此,提出一种基于共享内存的最优同步方法,即优化后的混合同步和事务内存同步的结合体,实验论证此优化方法的可行性,程序运行更加高效。  相似文献   

13.
数据分布是提高分布存储系统上OpenMP程序性能的主要方法之一.基于两阶段分析方法,提出了一个面向OpenMP程序的自动数据分布框架及算法并实现其于CCRG OpeMP编译器之中.第一阶段,编译器分析程序中数据访问模式,结合OpenMP程序中DO指导命令提供的任务调度信息,为每次数组访问产生分布方式候选;第二阶段,采用多面体作为迭代空间及数组空间的几何模型,提出自动计算有界多面体中整数点个数以衡量通信量之多少的方法,并且用Ehrhart多项式表示其结果以更便于符号比较和最优分布方式的选取.实验表明,在最终选取的分布方式下,程序性能明显优于其他候选分布方式.  相似文献   

14.
OpenMP中隐式数据并行编译策略   总被引:1,自引:0,他引:1  
为了实现OpenMPFortranAPI2.0中通过WORKSHARE语句提供的对隐式数据并行的支持,提出了计算划分原则、计算划分算法以及实现方案。还给出了针对编译中产生的冗余同步以及相容的DO循环等情况的优化技术。将实现方案与EFC(Intel产品编译器)进行了对比测试。结果表明,该并行编译策略有效地实现了对隐式数据并行的支持。所述优化技术能够提高并行程序执行效率:消除冗余同步对于负载不平衡的情况所提高的效率与各线程最小总等待时间成正比;合并循环体能提高7%左右的效率。  相似文献   

15.
介绍了OpenMP的并行执行原理和语言规范,重点讨论了OpenMP的循环并行化、迭代相关、数据共享、任务调度等问题,最后使用OpenMP技术优化了遗传算法,并进行了性能的对比.  相似文献   

16.
相控阵雷达仿真系统并行计算研究   总被引:1,自引:0,他引:1  
针对共享存储多处理器的集群环境,研究了减少相控阵雷达仿真系统运行时间的并行计算方法.根据相控阵雷达多个波束处理过程的相对独立性和信号处理仿真中多个距离单元采样点的计算特点,提出了一种粗粒度消息传递接口(MPI)分布式内存和细粒度OpenMP共享内存混合编程的两级并行方法.实验结果表明,并行计算使系统的仿真速度有较大提高.  相似文献   

17.
本文提出了一种由AppleⅡ机和Z80机组成的多,微机系统(MMCS)。该系统采用共享存贮器方式交换信息,通过制定通讯协议,使MMCS不仅能传送数据块和程序块,而且具有吞吐率高、模块性好、结构简单灵活等特点。  相似文献   

18.
基于共享内存的高效OpenMP并行多层快速多极子算法   总被引:2,自引:1,他引:1  
提出并实现了一种基于共享内存并行平台的OpenMP并行多层快速多极子算法.结合OpenMP并行算法开发的要点和多层快速多极子算法数据分布的特性,对多层快速多极子的填充矩阵模块、矩阵向量相乘中的远相互作用部分进行了OpenMP并行化设计.在分析调度方式和循环次序对计算效率的影响的基础上,提出了一种高效的OpenMP并行多层快速多极子方案.数值实验表明,并行算法与串行精度一致,OpenMP并行算法具有较好的并行效率.  相似文献   

19.
该文提出了一种OpenMP翻译技术,旨在提高OpenMP编译系统的性能,并在这种技术基础上构造了一个完整的基于ORC的OpenMP编译系统。系统采用了下面的主要技术来提高性能:1)系统集成在后端的优化编译器中,具有更多的优化机会,并可以采用更为精细的开销模型;2)提出了一种基于指导语句全局嵌套类型的OpenMP翻译技术,可以有效地减少翻译代码的长度,并减少运行时开销。这个OpenMP系统从设计开始,就是为了提供一个合适的编译技术研究平台,具有更好的可控制性、可调试性和丰富的工具支持。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号