首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 500 毫秒
1.
通过对某具有代表性的基于基元化学反应的串行爆轰计算程序的编制思路和结构进行分析,发现程序中对化学反应的求解花费了大量的计算时间,对程序中这部分进行了基于多进程的并行化处理,并进一步考核了并行化后程序的可靠性和计算效率。结果表明并行化处理后的程序在计算气相爆轰问题时是可靠的。对程序的简单并行化处理,可以充分利用多核电脑及计算机集群等多进程的优势,极大地提高程序的计算效率,达到“四两拨千斤”的效果。  相似文献   

2.
理论地震图的F-K算法的并行实现   总被引:2,自引:0,他引:2  
对F-K算法进行了并行化改进,从而使其可以利用PC-Cluster或者并行计算机多节点计算的资源优势,提高计算速度.比较发现,并行后的计算速度大大提高,在计算时间较长的情况下,并行F-K算法的运算速度基本与处理器的个数成正比,为反演震源参数和地下结构提供了更为快捷的计算工具.  相似文献   

3.
基于改进粒子群优化的弹道并行求解算法   总被引:1,自引:0,他引:1  
弹道解算精度与解算时间直接影响了火控系统的整体性能,然而精度与时间往往是相互矛盾的两个因素,在不损失精度的情况下提高解算速度具有重要意义. 基于改进粒子群优化的弹道并行求解算法,采用并行求解算法充分发挥多核计算机的性能,从而在不损失精度的前提下有效地提高了弹道解算的效率. 该方法首先通过引入粒子群优化算法将弹道解算转化为一个寻优过程,利用周氏迭代修正公式计算得到的修正角度引导粒子群更新加快算法的收敛速度;然后通过将粒子分配到并行域的线程中将弹道解算方法并行化. 数值实验表明本方法可以有效提高弹道解算的收敛速度,将计算时间平均缩短为原有时间的1/5.   相似文献   

4.
材料微观组织数值模型模拟是一个密集型计算问题,其模拟时间太长且模拟规模太小.特别是在反映现实模拟的三维多场耦合材料枝晶成型过程中,由于模拟规模太小和计算时间太长,从而导致不能清楚地、及时地反映出枝晶的生长过程.为解决这两个问题,提出使用MPI对等模式对耦合流场的相场法进行三维晶枝生长模型模拟计算,并沿x轴等值面切割整个模型,把分割后的小模型分到不同MPI节点中实现并行运算.结果表明:在相同模拟规模下,10个MPI并行计算节点的加速比可达串行的19.9倍;同时其模拟规模也从串行的211×211×211个网格数增加到388×388×388个网格数.证明使用MPI并行计算对PF-LBM进行模拟解决了单CPU上模拟规模太小和计算时间太长的问题.  相似文献   

5.
将详细化学动力学的HCCI单区模型嵌入三维流体力学程序中,取代传统内燃机三维数值模拟中简化燃烧模型,利用详细化学反应动力学计算三维燃烧过程,建立三维CFD耦合详细化学反应动力学模型.生成了带复杂进气道的实际燃烧系统的贴体计算网格,建立了缸内直喷HCCI燃烧系统进气-喷雾-混合气形成-压缩-燃烧工作过程的模型.为满足模拟整个HCCI发动机物理化学过程(包括进气,压缩,喷雾,燃烧和排放)执行时间的要求,提出了一套能使计算工作量大为减少的详细化学反应动力学与三维CFD耦合的模拟策略,利用试验方法确定计算边界条件,预测了进气-喷雾-燃烧-排放的HCCI发动机工作过程,通过发动机台架试验对比验证了模型的准确性.  相似文献   

6.
采用计算任务量大小的方法,解决了在紧嵌套循环自动并行化过程中存在循环并行化的并行粒度确定问题以及循环自动并行化中数据划分的数据访问局部性问题,在多核系统中实现了紧嵌套循环自动并行化时的数据访问局部性方案和并行化方法,从而构造了一个基于任务量划分的循环自动并行化模型,降低了程序自动并行化中小任务量并行带来的开销.  相似文献   

7.
有限元方法FEM(Finite Element Method)是计算电磁学中非常重要的一种方法,而当问题规模较大时或计算量较大时,传统串行单机FEM难以胜任.本文在基于消息传递(MPI)的分布式并行系统上,采用有限元方法对电磁场问题进行并行求解.有限元方法形成的系数矩阵可以表示成块三对角矩阵,适合采用并行多分裂方法高效求解.并行计算技术的运用减少了计算时间并扩展了可处理问题的规模.结果表明,将并行技术应用于电磁有限元计算是有效并且可行的.  相似文献   

8.
随着大规模网络数据的增加,可扩展性成为推荐系统的一个关键因素,为此提出一种基于并行化谱聚类的协同推荐算法.首先通过并行化改进的谱聚类方法对项目进行聚类;然后在基于用户的协同推荐算法基础上,结合已聚类的项目打分信息,提出一种改进的相似用户计算方法,并进行推荐;最后在数据集上进行测试.结果表明,该算法可以有效降低时间复杂度,推荐精确度和推荐效率也有显著提高.  相似文献   

9.
针对开源深度学习快速特征嵌入的卷积框架(Caffe)在Android移动端进行前向计算时存在的兼容性和时间性能差的问题,提出了基于Caffe的嵌入式同构、异构并行化改进设计方法。该方法将Caffe及其第三方库通过交叉编译移植到嵌入式移动平台后,利用同构的多核多线程方法分别对卷积层、输入帧之间的部分前向计算过程进行了并行化;实现了采用开放运算语言(OpenCL)的异构图形处理器(GPU)卷积计算,进一步提升了框架的处理速度。对3种经典的深度神经网络模型MNIST、Cifar-10和CaffeNet进行了测试对比,测试结果表明:在没有任何模型精度损失的条件下,并行后的前向计算耗时明显低于并行前,时间性能提升最高达到2倍。所提方法能够将深度学习框架Caffe高效地、并行地部署和应用于嵌入式移动多核芯片上。  相似文献   

10.
在面向计算部署到数据节点端执行的分布式并行环境下,提出一种基于图着色理论的适用于矢量空间数据的部署方法,将空间数据粒度的部署问题转化为图顶点着色的过程,提高了任意空间区域的信息查询效率.给出基于图着色理论的数据部署方法,并通过节点的任务量进一步改进算法,使得该算法可实现海量空间数据粒度的离散化部署,提高了空间数据检索和查询的并行化程度,充分利用了并行计算资源.  相似文献   

11.
隐马尔可夫模型(HMM)是建立在马尔可夫链的基础上的统计模型.虽然隐马尔可夫模型是一种计算高效的机器学习模型,但是当处理的数据集规模过于庞大时,分析的时间太长.因此,我们有必要研究隐马尔可夫模型的并行化设计,以提高模型的运算速度.近年来,开放计算语言(OpenCL)的出现,使得设计通用的并行程序成为可能.该文,我们分析了隐马尔可夫模型三类算法的并行特性,并设计基于OpenCL的并行实现.实验结果表明,隐马尔可夫模型在GPU上的并行化实现最高获得了640倍的加速比.  相似文献   

12.
为了提高预测并行软件性能的准确性和并行软件的开发效率,提出了一种基于单程序多数据流(SPMD)并行应用软件模块化技术的性能分析预测和并行软件辅助开发方法.通过量化计算开销、通信开销、通信与计算的耦合系数,阐述了在并行计算机系统中利用该方法开发并行计算软件和预测并行计算软件性能的过程.并就影响并行软件性能预测和开发效率的模块设计、模块性能数据建模、模块组合和计算与通信重叠等技术进行了研究.实验表明,该方法提高了预测并行计算软件性能的准确性,也提高了并行计算软件的性能和开发效率.  相似文献   

13.
为降低粒子群优化算法(PSO: Particle Swarm Optimization)时间和空间的复杂度随问题规模的增大而越来越高的问题, 对图形处理器(GPU: Graphic Processing Unit)用于并行计算的方法进行了分析, 利用GPU的并行特性, 实现了粒子群优化算法路径搜索过程的并行化。测试函数实验结果证明, GPU平台较CPU模式下的计算, 其搜索速率有明显提高。  相似文献   

14.
拓扑优化均匀化方法的改进迭代算法   总被引:1,自引:0,他引:1  
针对大型连续体结构拓扑优化中迭代步过多、计算时间过长的问题,对拓扑优化均匀化方法进行了改进,并通过引入的2个密度阈值来控制计算过程.算例表明,采用改进的拓扑优化均匀化方法可有效减少迭代步数、节省计算时间,且不会影响拓扑优化计算结果.  相似文献   

15.
针对四冲程内燃机活塞在气缸套中的二阶运动轨迹的求解问题,提出基于消息传递接口(MPI)并行化求解非线性二阶偏微分方程,计算时用消息传递的并行编程模型对不存在数据相关的部分实施并行化。对各个模块的划分以及颗粒度的大小进行了论述。对求解问题中不同的求解精度要求和通信方式,分别在SUN工作站和上海超级计算中心神威机上进行计算,对各自的总计算时间和并行时间做了对比分析,并给出了加速比和适宜的进程数。研究表明,改进后的并行算法可以在较短的时间内得到高精度的结果,且具有很好的加速比。  相似文献   

16.
针对摄像设备拍摄视频抖动问题和实时处理要求,本文提出一种改进的基于角点检测的并行化电子稳像算法.该算法采用并行计算和软硬件协同计算的方法,对基于Harris角点检测及Hu几何不变矩的电子稳像算法进行了改进,算法通过网格划分和区域极限值的并行计算,减少了角点检测的计算量,采用并行化改进的RANSAC计算提升了剔除误匹配的处理效率,并基于图形处理器(Graphic Processing Unit,GPU)和FPGA完成了电子稳像算法的优化设计实现.实验结果表明,本文算法在保证良好稳像质量的同时,对720p视频进行单帧稳像的时间仅为25.48ms,能够完成帧率为30帧/s的分辨率为1 280×720的视频实时稳像.  相似文献   

17.
提出了面向大型飞机设计的气动模拟软件CCFD的架构和实现方法.对于复杂流场建模和高分辨率湍流数值模拟,CCFD采用对比分析各种计算模型和提高计算网格分辨率的方法来得到高精度的模拟结果和更精细的流场模型.CCFD在并行编程模型、负载平衡、通信重叠等多个方面针对万核级的大规模并行计算进行了改进.同时,CCFD实现了批处理作业、双模式控制参数设置、计算过程监控等功能的用户友好操作界面.通过在"天河一号"上进行的测试可以看出,随着并行规模从128核增加到近万核(8 192核),作业的运行时间稳定降低,加速比稳定增加.  相似文献   

18.
本文讨论多处理机环境下的并行划分算法和并行处理问题,介绍两种实时并行调度策略——单级化非嵌套式算法和多级化嵌套式算法,给出在最小可能时间内对处理工作P所需要的最少处理机数的估算公式.作为算法的使用实例,本文最后介绍了多级化嵌套式算法在雷达数据处理中的应用,解决了将紧耦合多微机系统用于实时系统中实时任务并行调度的关键问题,取得较满意的效果.  相似文献   

19.
混合网格化学非平衡绕流通量分裂格式及并行算法   总被引:5,自引:0,他引:5  
讨论了非结构混合网格上的二阶VanLeer逆风矢通量分裂格式,并将其应用于三维高超声速化学非平衡粘性流场的并行计算.高超声速绕流的复杂性要求对N-S方程求解的数值模拟方法应具有较高的计算精度及效率.我们针对混合网格上的有限体积格心格式,引入辅助点方法建立了具有空间二阶精度的VanLeer逆风矢通量分裂格式,提高了数值格式的模拟精度,并采用分布式并行化计算技术用以提高计算效率.粘性通量的计算采用中心格式,化学非平衡动力学模型为7组元空气反应模型,采用考虑了化学反应特征时间的当地时间步长显式Runge-Kutta时间推进格式.对三维双椭球外形的高超声速粘性流场进行了并行计算,获得满意的结果.  相似文献   

20.
波动方程的地震波场正演模拟是研究复杂地区地震资料采集、处理和解释的有效辅助手段,其巨大的计算量往往是单台计算机难以承受的.MPICH-G2是传统的紧耦合并行策略在网格中的实现,然而它对网格环境要求高,带宽需求大,且已不能适应目前基于Web Service的网格架构.研究并实现了网格松散耦合并行策略,将任务按照粗粒度方式划分,减少子任务间同步次数和通信量,有机地将网格计算和波动方程的地震波场正演模拟结合起来.由于地震波场正演模拟是计算密集型任务,节点间数据传输量并不很大,非常适合这种松散耦合的并行策略.实验表明,这种网格并行方式可以有效地减少地震波场正演模拟的时间,提高效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号