首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
p_HPF是一个基于cluster体系结构的HPF并行编译系统,它不仅支持数据并行计算范例,而且也支持任务并行范例。给出了p_HPF并行编译系统的体系结构和实现策略,介绍了p_HPF实现数据并行和任务并行的机制,包括数据分布方法、外部过程调用等。还给出用p_HPF求解N_body、快速傅立叶变换、单炮地震资料的处理等应用实例。  相似文献   

2.
求解隐式差分方程的并行迭代法   总被引:2,自引:0,他引:2  
刘庆富 《贵州科学》2002,20(2):29-36
本文研究了求解隐式差分方程的并行迭代方法,其基本思想是把隐式差分方程组划分为若干个子方程组来分别同时进行迭代求解。本文给出了构造隐式方程组并行迭代法的一般过程--分段隐式迭代法,推导论证了它的收敛性,并阐明了它处理子方程组的优越之处。同时,据其本身特点,把它推广到二维情形。为说明此迭代法的有效性,本中针对具体例子给出了数值试验结果。  相似文献   

3.
基于MPI+OpenMP的多层次并行偏移算法研究   总被引:1,自引:0,他引:1  
根据PC集群的系统特性和叠前深度偏移的理论特点,提出了多层次并行单平方根和双平方根叠前深度偏移算法.从波动方程叠前深度偏移的概念和特征入手,针对单平方根和双平方根波动方程的实现特点,利用PC集群各节点内的每个内核,构建两类多层次并行叠前深度偏移算法.理论模型验证了其正确性,得到了较好的成像效果,不同类型的多层次并行偏移算法计算结果有所差异.多层次并行偏移算法是在实现MPI并行偏移的基础上,对集群各节点内核的充分利用,有利于提升PC集群的计算性能,为叠前深度偏移的实际推广奠定基础.  相似文献   

4.
p-HPF是一个基于cluster体系结构的HPF并行编译系统 ,它不仅支持数据并行计算范例 ,而且也支持任务并行范例。给出了 p-HPF并行编译系统的体系结构和实现策略 ,介绍了 p-HPF实现数据并行和任务并行的机制 ,包括数据分布方法、外部过程调用等。还给出用 p-HPF求解N-body、快速傅立叶变换、单炮地震资料的处理等应用实例。  相似文献   

5.
为了快速求解10000个粒子的湍流碰撞聚合问题,采用OpenMP对Smoluchowski方程的FORTRAN求解程序进行了并行处理.数值结果表明:在不改变串行程序结构的情况下,仅对循环体部分进行并行处理,并行效率可高达80%,且串行程序与并行程序的计算结果完全吻合.对于大计算量循环体的并行计算,采用全部处理器进行并行计算时耗时最小.但是对于小计算量循环体的并行计算,采用全部处理器进行并行计算时耗时不一定最小.  相似文献   

6.
本文是对多核程序设计的一种探索,在OpenMP模型下以赫夫曼算法为基础设计并行压缩程序.首先对传统的串行程序进行分析,使应用程序开发人员了解程序行为、发现性能瓶颈、明确优化方向.再用OpenMP的基本结构进行并行程序的设计之后,借助开发工具对并行程序进行优化和调试,得到改进方案.然后在双核处理器上分别运行并行程序与串行程序,将两者进行性能上的比较,实验结果证明性能得到很大程度地提高。  相似文献   

7.
利用并行应用提供的信息给出群通信模式内在规律的定理和推论,从而优化消息调度.在数组分布给定和循环中数组下标为线性的情况下,首先给出通信表的周期性定理,然后进一步给出在一个周期下通信表中元素对应关系的定理和推论,即可以从通信表的一部分得到整个通信表.通过这一规律优化消息调度以避免冲突.实验结果表明经过优化后的群通信比MPI-Alltoallv实现具有更好的性能.该定理和推论可以应用于不同情况下的群通信优化.  相似文献   

8.
在多核环境下,对文件压缩与解压并行算法进行研究,提出一种基于OpenMP的文件压缩处理并行设计模型。该模型由查找热点代码、并行化分析、并行建模、实现、调试等步骤组成。以动态哈夫曼算法为研究算法,将多核压缩处理并行设计模型应用到文件压缩与解压中。并在文件并行处理过程中,与数据分解法相结合对数据文件进行分割,将分解后的数据由主线程分给多个处理器上的多个子线程来并行处理,以此提高多核处理器的利用率并提高文件压缩效率。最后通过实验模拟验证模型以及算法性能。研究结果表明:在八核处理器下通过对文本文件、图像文件和音频文件等多种不同类型文件进行压缩解压试验,验证了动态Huffman并行算法与串行算法相比其加速比可以达到1.5~8.0倍,性能也得到很大提高。  相似文献   

9.
模块是八十年代程序设计语言中最主要的特色之一,它的出现给编译技术提出了新的课题。本文介绍了Modula-2中提供的四类不同的模块,并给出了在Modula-2/AD实现中相应的编译处理方法。  相似文献   

10.
给出了多项式参数方程定义的参数曲线的有效隐式化算法,此算法主要是基于矩阵理论。首先,给出的是所求隐式方程次数的上界及其隐式方程的一般表示,并由构造的隐式矩阵的零向量,进一步得到了所求隐式方程的所有系数,从而得到了参数曲线的隐式方程。文中给出的一些例子详细证明了该算法的准确性和有效性。  相似文献   

11.
数据分布是提高分布存储系统上OpenMP程序性能的主要方法之一.基于两阶段分析方法,提出了一个面向OpenMP程序的自动数据分布框架及算法并实现其于CCRG OpeMP编译器之中.第一阶段,编译器分析程序中数据访问模式,结合OpenMP程序中DO指导命令提供的任务调度信息,为每次数组访问产生分布方式候选;第二阶段,采用多面体作为迭代空间及数组空间的几何模型,提出自动计算有界多面体中整数点个数以衡量通信量之多少的方法,并且用Ehrhart多项式表示其结果以更便于符号比较和最优分布方式的选取.实验表明,在最终选取的分布方式下,程序性能明显优于其他候选分布方式.  相似文献   

12.
该文提出了一种OpenMP翻译技术,旨在提高OpenMP编译系统的性能,并在这种技术基础上构造了一个完整的基于ORC的OpenMP编译系统。系统采用了下面的主要技术来提高性能:1)系统集成在后端的优化编译器中,具有更多的优化机会,并可以采用更为精细的开销模型;2)提出了一种基于指导语句全局嵌套类型的OpenMP翻译技术,可以有效地减少翻译代码的长度,并减少运行时开销。这个OpenMP系统从设计开始,就是为了提供一个合适的编译技术研究平台,具有更好的可控制性、可调试性和丰富的工具支持。  相似文献   

13.
基于OpenMP矩阵相乘并行算法的设计   总被引:1,自引:0,他引:1  
目的设计并实现一种基于数据划分的矩阵乘法的并行算法,将划分的数据交给多个线程同时执行,充分挖掘计算机的性能。方法根据OpenMP并行编程的基本风格,并在Visual Studio2005上搭建能够实现并行编程的环境平台。结果并行算法所花费的时间较非并行算法短。结论通过与非并行矩阵乘法性能进行比较,验证该算法可以有效地利用多核处理器的优势。  相似文献   

14.
介绍了OpenMP的并行执行原理和语言规范,重点讨论了OpenMP的循环并行化、迭代相关、数据共享、任务调度等问题,最后使用OpenMP技术优化了遗传算法,并进行了性能的对比.  相似文献   

15.
“编译原理”双语教学的实践与探索   总被引:2,自引:0,他引:2  
双语教学正在高校计算机专业中积极开展 ,其中呈现出诸多问题值得探讨。本文结合我校“编译原理”课程双语教学的实践经验 ,从教材的选取、实验设计、授课方式等方面论述该课程双语教学的实施方法。  相似文献   

16.
编译器验证是汽车电子软件开发过程中的重要一环.在分析了相关安全要求和通用验证方法的基础上,提出了一种基于测试的编译器安全验证策略,并给出了具体实现过程.  相似文献   

17.
基于有关因果关系复合的CommunicationClosedLayer理论,提出了一种结构化并行程序设计方法,以支持不同并行平台的“通用”并行程序设计方法.因果关系复合的范式定理的证明在理论上保证了采用“SEQOFPAR”形式进行结构化并行秩序设计的可行性;良好的代数性质也使得在这一模型中可采用代数方法的程序变换来进行并行程序设计、优化和验证.与其他并行程序设计模型和方法相比,提供了一种非常自然地综合描述数据并行和控制并行的途径;特别是基于代数变换的程序变换技术,提供了一种既独立于具体的体系结构又可高效实现的可能性.  相似文献   

18.
基于很多大数据应用存在对数据进行多种并行处理的需求, 提出两层混合式并行方法, 即执行单元的混合并行和计算模型的混合并行. 通过在同一个计算节点上执行单元的混合并行, 充分挖掘基础设施的计算能力, 从而提高数据处理性能; 采用在同一个执行引擎中集成多个计算模型的并行方法, 以适合应用多样异质处理模式. 不同的混合并行方法可以契合不同的数据和计算特点, 以满足不同的并行目标. 介绍了混合式并行方法的基本思想, 并以前期开发的并行编程模型BSPCloud为基础, 阐述了进程和线程混合并行、BSP和MapReduce混合并行的主要实现机制.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号