首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
本文在CUDA框架下设计与实现基于GPU的晶格Boltzmann方法(LBM)的并行算法.为进一步提高计算效率,本文分别研究几种典型的优化策略对计算效率的影响,并给出了一种集多优化策略为一体的综合优化解决方案.以圆管内Poiseuille流为算例的实验表明,采用新综合优化方案设计的LBM并行算法能够获得更高的计算效率.  相似文献   

2.
本文提出了带形系统两种并行算法,带主元高斯划分法,只需要系数阵非奇异即可,另对三对角系统给出了一个特别并行算法,并计算共并行效率和并行加速。  相似文献   

3.
为提高压裂水平井试井多参数自动拟合的计算精度、速度和稳定性,将传统方法、智能算法和并行算法相结合,提出并行分群式粒子群优化算法,并将高斯-牛顿法与粒子群算法相结合,同时采用OpenMP并行算法求解。结果表明:在粒子群优化算法中,通过粒子分群使粒子搜索方向趋近于线性,避免了粒子群算法易陷入局部最优的问题,加快了搜索速度;与高斯-牛顿法相结合保证了计算的稳定性;采用OpenMP并行算法求解降低了模型的复杂度,提高了计算效率;分群式粒子群优化算法比其他优化算法计算速度更快,计算精度更高,并可在一定程度上为多裂缝水平井试井解释划分流动阶段。  相似文献   

4.
为了更快更有效地提高大规模电力系统潮流计算的速度,引入并行处理技术,文中提出了一种基于MPI的电力系统潮流P-Q分解法的并行算法,将潮流计算问题分解为多个子任务在基于MPI消息传递模式的多处理机中同时进行计算.运用该并行算法,针对不同规模的网络进行潮流计算,结果表明,该并行算法能有效地提高电力系统计算的速度,具有广阔的应用前景.  相似文献   

5.
介绍了分子动力学并行仿真计算的软硬件环境,分析了现有的几种并行算法,确定采用区域分解法作为并行算法,并在此基础上提出了基于区域二次划分的分子动力学并行仿真算法.另外,阐述了原子链、原子近邻表和原子亲属表的概念,提出了基于永久序号的消息传递策略.最后,设计了分子动力学并行仿真程序,并分别在1、2、3、4台结点机上进行了实验,运行结果表明:加速比随着结点数的增加而增加,并行效率虽略有下降但都在87.5%以上,并行效率并没有随着结点数的增加有明显的降低,说明并行程序具有很好的扩展性.  相似文献   

6.
大跨屋盖边缘区域风荷载表现出明显的非高斯特性,为确定非高斯风压时程的极值风压,并与传统的风荷载理论所采用的峰值因子法相衔接,采用Hermite矩模型将非高斯风压时程变换为高斯时程,计算高斯时程的峰值因子,然后通过逆变换得到非高斯时程的峰值因子.通过对大跨鞍型屋盖的风洞实验数据进行处理,得到不同工况下屋面各测点的峰值因子,并对其特性进行系统分析.实测负向峰值因子与计算峰值因子的对比结果表明,计算峰值因子具有较好的计算效果.  相似文献   

7.
电力系统潮流并行算法的研究进展   总被引:32,自引:0,他引:32  
随着高性价比可扩展集群并行系统的逐步成熟和应用 ,大规模电力系统潮流并行计算和分布式仿真成为可能。该文首先简要介绍了电力系统的潮流计算模型及基本算法 ,分析了算法中存在的困难。然后分析了 4类较重要的电力系统潮流并行算法 :分块法、多重因子化法、稀疏矢量法和逆矩阵法 ,同时讨论了这 4种潮流并行算法的基本原理和实用效果 ,比较了各种并行算法的优点和局限性 ,并指出基于集群系统的粗粒度区域分解潮流并行算法最具发展潜力。  相似文献   

8.
用传统的串行算法进行矩阵相乘运算会受到矩阵规模、单机的CPU主频、内存大小和存储器空间等方面的限制.而使用并行算法是解决上述限制的最有效途径.为此,在集群计算环境下,使用SPMD计算模型和基于MPI消息传递技术设计实现了矩阵相乘的并行算法.实验表明,此并行算法在一定矩阵规模下具有较好的加速比和并行效率.  相似文献   

9.
经典高斯扩散模式,如高斯点源烟流模式,成立的前提条件是在扩散过程中风向保持不变,然而在实际应用中风向却常常是变化的.本文以高斯点源烟流模式为例介绍了可变风向的空气污染扩散模拟方法.  相似文献   

10.
图像噪声降低了图像信噪比和质量,去噪是图像处理工作的重要环节之一.本文提出了一种基于开放式计算语言(OpenCL)架构的图像中值滤波快速降噪并行算法.介绍了OpenCL体系结构特点和中值滤波处理流程.根据图形处理器(GPU)的并发结构特点,对图像中值滤波功能模块进行了并行优化,降低了算法复杂度.通过充分激活NDRange索引空间中的工作组和工作项来提高数据访问效率,优化内核工作组配置参数,实现了中值滤波器的并行处理.实验结果表明,在图像质量保持不变的情况下,与基于CPU的串行算法、基于开放多处理(OpenMP)并行算法和基于统一计算设备架构(CUDA)并行算法性能相比,图像中值滤波并行算法在OpenCL架构下NVIDIA GPU计算平台上分别获得了29.74、17.29、1.15倍的加速比.验证了算法的有效性和平台的可移植性,基本满足应用的实时性处理要求.  相似文献   

11.
To reduce resources consumption of parallel computation system,a static task scheduling optimization method based on hybrid genetic algorithm is proposed and validated,which can shorten the scheduling length of parallel tasks with precedence constraints.Firstly,the global optimal model and constraints are created to demonstrate the static task scheduling problem in heterogeneous distributed computing systems(HeDCSs).Secondly,the genetic population is coded with matrix and used to search the total available time span of the processors,and then the simulated annealing algorithm is introduced to improve the convergence speed and overcome the problem of easily falling into local minimum point,which exists in the traditional genetic algorithm.Finally,compared to other existed scheduling algorithms such as dynamic level scheduling(DLS),heterogeneous earliest finish time(HEFT),and longest dynamic critical path(LDCP),the proposed approach does not merely decrease tasks schedule length,but also achieves the maximal resource utilization of parallel computation system by extensive experiments.  相似文献   

12.
GPS接收机并行捕获算法的研究   总被引:3,自引:0,他引:3  
对全球定位系统(global positioning system,GPS)中3种并行捕获算法进行了理论分析,同时针对捕获算法运算量、捕获时间、捕获灵敏度以及捕获结果 4个方面进行了对比分析和仿真验证。仿真分析表明:3种并行捕获算法均能有效捕获GPS信号。其中,匹配滤波算法硬件实现简单,但运算量大、捕获速度慢;C/A(coarse/acquisi-tion)码循环相关算法运算量小、捕获速度快,但硬件实现复杂;部分匹配滤波-快速傅里叶变换(partial matched fil-ter-fast Fourier transform,PMF-FFT)算法运算量适中、捕获速度快、硬件实现简单,但其捕获灵敏度相对于另2种算法低0.9 dB。所以,PMF-FFT算法更适合硬件大规模推广且实用价值高。  相似文献   

13.
AR(Augmented Reality增强现实)系统运行时包含很多图形、图像的相关计算任务,要求系统实时完成,这个问题在基于PC的AR系统中更为突出。为了提高IP(1mage Processing图像处理)计算的实时性,提出了一种可行的并行解决方案。硬件上采用基于SMP(Symmetric Multiple Processor对称多处理器)的Cluster结构,算法上运用并行图像算法。在Windows操作系统下用多线程和MPI(Message Passing Interface消息传递接口)技术,设计了并行图像算例实验,并对这两种方法进行了综合比较。  相似文献   

14.
在限定处理机个数的 CREW PRAM并行计算模型上,给出了图论中一些基本问题的并行算法.所给并行算法的费用c(n)=p(n)*t(n)是目前已知的最好结果,其中p(n),t(n)分别是对一具有n个顶点图实施并行算法所用处理机的个数和最坏情况下的时间复杂性。  相似文献   

15.
综述机器人反向动力学方程并行计算及实现。重点介绍最近几年利用多微处理机进行并行计算的调度算法。最后提出一些结论和观点。  相似文献   

16.
主要讨论了国际上近年发展起来的一类新型稳定算法-ABS算法。首先简要介绍ABS算法的过程,然后针对求解大型稀疏线性方程组问题讨论了投影阵的稀疏结构以及方程组次序的重排方法。为了在并行机上实现该算法,讨论了算法的并行化问题,最后,给出了数值计算的例子及运算时间。  相似文献   

17.
本文给出了一类树问题的快速并行算法.这些问题包括:求树中任意两顶点之间的路径和路径长度、求所有顶点的深度等.以这些基本算法为基础,给出了求树中任意两个顶点的最小公共祖先问题、边修改动态最小生成树问题和树同构问题的并行算法.本文使用的模型是单指令流多数据流共享存贮器并行计算机,允许多个处理机同时读存贮器的一个单元的内容但不允许同时写,称这种模型为CREW PRAM.对n个顶点的树,以上算法均使用O(n)个处理机,时间复杂度为O(logn).按Cook的定义,证明了以上问题都属于NC类.  相似文献   

18.
网络连接机群是一种有效的并行计算工具,讨论了在此环境下流场分析和设计的并行计算问题。流场解中采用了Euler方程作为主控方程,并用有限体积方法和时间隐式方法进行求解。在MPI/PVM环境下用分区方法作了二维翼型和三维机翼绕流的并行计算。数值算例表明流场计算的正确性和并行计算的有效性,并讨论了影响加速比和并行效率的各种因素。用耦合流场解和并行遗传优化算法做了二维翼型和三维机翼的单目标/双目标数值优化。算例表明:使用的适应函数优于传统线性组合法构成的,遗传算法计算三维优化问题时必须并行化。  相似文献   

19.
数字正射影像图(digital orthophoto map,DOM)数据通常以多分辨数据形式组织,并以切片的方式存储,而海量多分辨DOM数据的生成需要大量计算和大容量存储.针对此问题,提出一种基于并行计算熵迁移策略的并行多分辨DOM数据生成算法,以减少海量多分辨DOM数据的生成时间.该算法采用并行计算熵来衡量并行计算机系统的负载平衡程度,并以此判断何时需要进行负载迁移以及如何迁移.仿真实验表明,与串行算法相比,该算法能有效减少程序执行时间,并且能获得较高的加速比和并行效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号