首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 359 毫秒
1.
基于共享内存的高效OpenMP并行多层快速多极子算法   总被引:2,自引:1,他引:1  
提出并实现了一种基于共享内存并行平台的OpenMP并行多层快速多极子算法.结合OpenMP并行算法开发的要点和多层快速多极子算法数据分布的特性,对多层快速多极子的填充矩阵模块、矩阵向量相乘中的远相互作用部分进行了OpenMP并行化设计.在分析调度方式和循环次序对计算效率的影响的基础上,提出了一种高效的OpenMP并行多层快速多极子方案.数值实验表明,并行算法与串行精度一致,OpenMP并行算法具有较好的并行效率.  相似文献   

2.
该文提出了一种OpenMP翻译技术,旨在提高OpenMP编译系统的性能,并在这种技术基础上构造了一个完整的基于ORC的OpenMP编译系统。系统采用了下面的主要技术来提高性能:1)系统集成在后端的优化编译器中,具有更多的优化机会,并可以采用更为精细的开销模型;2)提出了一种基于指导语句全局嵌套类型的OpenMP翻译技术,可以有效地减少翻译代码的长度,并减少运行时开销。这个OpenMP系统从设计开始,就是为了提供一个合适的编译技术研究平台,具有更好的可控制性、可调试性和丰富的工具支持。  相似文献   

3.
关于Open MP:一个并行编程接口   总被引:1,自引:0,他引:1  
OpenMP是一个公认的共享存储系统的并行编程接口.它由一些语言指导(directives)及库函数组成,并建立在Fortran或者C、C++语言的基础上.优点是简单、通用,有利于快速开发并行程序.介绍了它的发展历史、执行模型以及它的三个组成部份,即语言指导(一些在Fortran、C或C++基础上增加的注释语句)、运行库函数(共有10个与执行环境有关的运行库函数)和环境变量(设置该OpenMP执行时所需的线程总数).文中还提供了已公开发布的OpenMP应用程序的情况,并讨论了它将来的发展趋势.OpenMP的推广,还需要解决它的可扩展性问题.  相似文献   

4.
Analysis of Factors Affecting Execution Performance of OpenMP Programs   总被引:3,自引:0,他引:3  
OpenMP is able to develop multithreaded programs with lower cost as a promising way to quickly parallelize a great number of serial programs. However, there are many difficulties when developing OpenMP multithreaded programs. Most importantly, the performance of OpenMP programs cannot be guaranteed, which has greatly affected the application of OpenMP. This paper examines several factors that affect the execution performance of OpenMP programs, including loop transformation, scheduling strategy, the number of threads, and nested parallelism. The results show that one of the key reasons for performance degradation is load imbalance, which can be corrected by reasonable use of these key factors to improve the execution performance of OpenMP programs.  相似文献   

5.
针对二元合金三维相场模型模拟研究中存在的计算区域小、计算效率低,难以满足二元合金大规模模拟的需求,提出基于MPI+OpenMP混合编程模式的并行方法.在相同计算规模下对MPI和OpenMP并行技术的优缺点进行分析.在计算机集群环境下对MPI+OpenMP混合编程模式和纯MPI并行方法的并行效率进行对比和分析.结果证明:基于MPI+OpenMP混合编程模式可以有效地扩大二元合金三维相场模型的计算规模;在多核集群环境下,相对于纯MPI并行方法,MPI+OpenMP混合编程可以更加有效地利用多核集群的多层次结构,取得更高的加速比和计算效率.  相似文献   

6.
虽然OpenMP是多核体系结构上的流行多线程并行编程模型,但是OpenMP编译器不检查数据相关性、访问冲突和其他可能导致程序错误执行的问题,这些问题传统上完全依赖用户使用锁机制来保证程序的正确性.锁机制的并行编程中存在并行程序效率和并行编程难度的矛盾.粒度大的锁机制编程容易,可应用的并行性挖掘比较差;粒度小的锁机制应用的并行性挖掘较好,可编程难度大,容易带来优先权倒置、死锁和锁护航等问题.通过动态二进制插桩技术,扩充OpenMP支持事务存储执行功能,可有效缓解OpenMP并行编程中并行程序效率和并行编程难度之间矛盾.  相似文献   

7.
采用LAM-MPI实现节点间粗粒度并行和OpenMP实现节点内细粒度并行这种混合编程方式为SMP机群提供了一种有效并行策略.讨论了LAM-MPI OpenMP混合编程环境的快速搭建以及多粒度混合并行编程方法,实现了分子动力学模拟问题的多粒度混合并行算法,并在搭建的8节点SMP机群环境中完成测试工作.  相似文献   

8.
基于Intel第二代Xeon Phi代号为Knights Landing(KNL)众核处理器平台,利用MPI+OpenMP混合编程策略对并行矩量法(Method of Moments, MoM)进行了优化.利用OpenMP编程技术和KNL的计算资源,提高了CPU(Center Processing Unit)使用率;线程的引入,大幅度减少了矩阵填充过程中进程间的冗余积分;为发挥KNL的512位矢量宽度优势,通过向量化优化进一步提高了循环结构的执行效率;对计算密集型、CPU利用率高的矩阵求解过程,通过引入的OpenMP编程策略,减少了MPI(Message Passing Interface)通信时间,加速了求解.数值结果表明,通过在KNL众核处理器平台上的优化,可以极大地提升矩量法计算复杂电磁问题的效率.  相似文献   

9.
基于CPU多核处理器实现了粗粒度2.5维电磁场并行正演算法, 使用OpenMP对串行算法的频率域进行粗粒度分解, 主线程进行任务分配, 从线程在CPU多核上并行计算各频率域电磁场值, 并分析了OpenMP并行效率与模型及核心数目的关系. 多组不同模型测试结果表明, 本文并行方法与串行方法得到的数值结果相同, 并获得了接近CPU逻辑核心数目的性能提升.  相似文献   

10.
多核技术的发展正引领软件研发发生基础性的变化。开发人员可以在代码中添加线程来利用系统所提供的多个内核,从而提升PC应用软件的功能和性能。本文介绍了共享存储系统并行编程接口OpenMP的模型、指令和库函数.以及Intel C++编译器9.1和Microsoft Visual Studio2005等对OpenMP的支持;着重探讨了二雏离散快速傅里叶变换并行算法的设计、实现与优化技术;展望了高性能并行计算软构件库的开发前景。  相似文献   

11.
黄伟建  周伟  李珍 《科学技术与工程》2013,13(15):4207-4211,4222
在海洋水龄谱数值模拟过程中应用并行计算技术可以显著提高运算效率。将适用于分布式存储环境的消息传递接口(Message Passing Interface,MPI)与适用于共享存储环境的开放式多处理(Open Multi-Processing,OpenMP)两种并行计算技术相结合,提出了一种适用于海洋水龄谱数值模拟的混合并行计算模型。对比了其与传统的纯MPI方式在多核心(Chip Muti-processors)集群上的运算效率,并在此基础上研究了混合模型的系统资源利用情况以进一步了解其扩展能力。实验结果表明,MPI+OpenMP混合并行水龄谱模型具有更高的运算效率,同时系统资源消耗明显低于纯MPI方式。  相似文献   

12.
为提高压裂水平井试井多参数自动拟合的计算精度、速度和稳定性,将传统方法、智能算法和并行算法相结合,提出并行分群式粒子群优化算法,并将高斯-牛顿法与粒子群算法相结合,同时采用OpenMP并行算法求解。结果表明:在粒子群优化算法中,通过粒子分群使粒子搜索方向趋近于线性,避免了粒子群算法易陷入局部最优的问题,加快了搜索速度;与高斯-牛顿法相结合保证了计算的稳定性;采用OpenMP并行算法求解降低了模型的复杂度,提高了计算效率;分群式粒子群优化算法比其他优化算法计算速度更快,计算精度更高,并可在一定程度上为多裂缝水平井试井解释划分流动阶段。  相似文献   

13.
数据分布是提高分布存储系统上OpenMP程序性能的主要方法之一.基于两阶段分析方法,提出了一个面向OpenMP程序的自动数据分布框架及算法并实现其于CCRG OpeMP编译器之中.第一阶段,编译器分析程序中数据访问模式,结合OpenMP程序中DO指导命令提供的任务调度信息,为每次数组访问产生分布方式候选;第二阶段,采用多面体作为迭代空间及数组空间的几何模型,提出自动计算有界多面体中整数点个数以衡量通信量之多少的方法,并且用Ehrhart多项式表示其结果以更便于符号比较和最优分布方式的选取.实验表明,在最终选取的分布方式下,程序性能明显优于其他候选分布方式.  相似文献   

14.
本文是对多核程序设计的一种探索,在OpenMP模型下以赫夫曼算法为基础设计并行压缩程序.首先对传统的串行程序进行分析,使应用程序开发人员了解程序行为、发现性能瓶颈、明确优化方向.再用OpenMP的基本结构进行并行程序的设计之后,借助开发工具对并行程序进行优化和调试,得到改进方案.然后在双核处理器上分别运行并行程序与串行程序,将两者进行性能上的比较,实验结果证明性能得到很大程度地提高。  相似文献   

15.
共享内存并行编程最优同步方法的研究   总被引:1,自引:1,他引:0  
共享内存并行编程是并行编程开发与研究的标准之一,为了保证程序运行的准确性和线程执行的高效率,对共享内存同步机制的研究具有重要意义。互斥锁与事件同步是Open MP标准中的混合同步机制,而斯坦福大学的Baek等人扩展Open MP提出的面向事务存储的Open TM应用编程接口,事务内存同步是其突出特点。通过研究发现混合同步存在部分互斥锁同步会严重消耗系统空间资源、线程资源利用率有待提高等问题,而事务同步忽视不可恢复行为的影响。因此,提出一种基于共享内存的最优同步方法,即优化后的混合同步和事务内存同步的结合体,实验论证此优化方法的可行性,程序运行更加高效。  相似文献   

16.
介绍了一种基于Open MP的多核并行程序设计方法,并使用此方法实现了对基于隐马尔可夫模型的Web文本挖掘程序的并行化改造.实验证明重新设计的多核并行程序相比于原有串行程序在多核微机系统上的运行时间大大减少、程序整体性能得到明显提升.  相似文献   

17.
相控阵雷达仿真系统并行计算研究   总被引:1,自引:0,他引:1  
针对共享存储多处理器的集群环境,研究了减少相控阵雷达仿真系统运行时间的并行计算方法.根据相控阵雷达多个波束处理过程的相对独立性和信号处理仿真中多个距离单元采样点的计算特点,提出了一种粗粒度消息传递接口(MPI)分布式内存和细粒度OpenMP共享内存混合编程的两级并行方法.实验结果表明,并行计算使系统的仿真速度有较大提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号