排序方式: 共有36条查询结果,搜索用时 15 毫秒
1.
在详细分析MODFLOW中P-PCG并行子程序包设计原理的基础上,针对其对层数较少模型加速效果不理想的特点提出了改进方案.在对同一算例数值模型的测试中,P-PCG并行子程序包加速比可以达到1.6,而改进后的P-PCG并行子程序包最大加速比可以达到3.2,明显提高了地下水数值模型的运行速度. 相似文献
2.
OpenMP中隐式数据并行编译策略 总被引:1,自引:0,他引:1
为了实现OpenMPFortranAPI2.0中通过WORKSHARE语句提供的对隐式数据并行的支持,提出了计算划分原则、计算划分算法以及实现方案。还给出了针对编译中产生的冗余同步以及相容的DO循环等情况的优化技术。将实现方案与EFC(Intel产品编译器)进行了对比测试。结果表明,该并行编译策略有效地实现了对隐式数据并行的支持。所述优化技术能够提高并行程序执行效率:消除冗余同步对于负载不平衡的情况所提高的效率与各线程最小总等待时间成正比;合并循环体能提高7%左右的效率。 相似文献
3.
4.
本文是对多核程序设计的一种探索,在OpenMP模型下以赫夫曼算法为基础设计并行压缩程序.首先对传统的串行程序进行分析,使应用程序开发人员了解程序行为、发现性能瓶颈、明确优化方向.再用OpenMP的基本结构进行并行程序的设计之后,借助开发工具对并行程序进行优化和调试,得到改进方案.然后在双核处理器上分别运行并行程序与串行程序,将两者进行性能上的比较,实验结果证明性能得到很大程度地提高。 相似文献
5.
为了快速求解10000个粒子的湍流碰撞聚合问题,采用OpenMP对Smoluchowski方程的FORTRAN求解程序进行了并行处理.数值结果表明:在不改变串行程序结构的情况下,仅对循环体部分进行并行处理,并行效率可高达80%,且串行程序与并行程序的计算结果完全吻合.对于大计算量循环体的并行计算,采用全部处理器进行并行计算时耗时最小.但是对于小计算量循环体的并行计算,采用全部处理器进行并行计算时耗时不一定最小. 相似文献
6.
多核CPU环境下的并行遗传算法的研究 总被引:4,自引:2,他引:2
多核CPU已经成为当前CPU市场上的主流产品,设计适应多核CPU环境的算法与软件势在必行.遗传算法是一种具有很强通用性的全局搜索方法,也是一种计算量大、极耗计算资源的算法,其传统的串行计算形式并不能充分利用多核的计算资源,将其设计为适应多核CPU环境的并行计算形式,具有重要的现实意义.将遗传算法的基本操作设计成并行执行形式,并利用OpenMP将其线程化,从而对不同规模的TSP问题的求解结果来看,加速比与计算效率随着规模的增大而提高. 相似文献
7.
张云锋 《科技情报开发与经济》2012,22(21):117-119
并行计算作为计算机行业未来发展方向的趋势已显而易见,而并行程序设计是研究的一个重要分支。介绍了ADPCM算法的基本概念,阐述了ADPCM算法并行化的设计与实现,分析了ADPCM并行算法的效率。 相似文献
8.
相控阵雷达仿真系统并行计算研究 总被引:1,自引:0,他引:1
针对共享存储多处理器的集群环境,研究了减少相控阵雷达仿真系统运行时间的并行计算方法.根据相控阵雷达多个波束处理过程的相对独立性和信号处理仿真中多个距离单元采样点的计算特点,提出了一种粗粒度消息传递接口(MPI)分布式内存和细粒度OpenMP共享内存混合编程的两级并行方法.实验结果表明,并行计算使系统的仿真速度有较大提高. 相似文献
9.
10.
基于OpenMP求解无容量设施选址问题的并行PSO算法 总被引:2,自引:1,他引:1
讨论无容量设施选址(UFL)问题,提出了一个基于OpenMP技术的并行多粒子群优化(PSO)算法.将整个种群分为若干子种群,同时利用局部信息来更新粒子速度,使得并行算法异步进行.算法运行一定代数后,每个子种群都会与其相邻种群交换最优粒子.通过将并行多粒子群算法对OR-library中的标准测试问题进行测试,并将计算结果与串行多粒子群算法的计算结果进行比较.相比之下,并行多粒子群算法执行时间短,特别对于大规模的计算问题,所得结果有更好的鲁棒性. 相似文献