首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
多核中央处理器(central processing units,CPU)-图形处理器(graphics processing units,GPU)异构平台为提高并行Agent仿真(parallel Agent-based simulation, PABS)在单机上的运行性能提供了一个更高效的硬件基础,但在当前相关研究中,还缺乏一般性的理论方法来指导并行Agent仿真将多核CPU和GPU的计算资源充分利用起来。通过分析多核CPU-GPU异构并行架构的特点,在方法论层面上建立了并行Agent仿真在多核CPU-GPU异构平台下的多层负载分配模型,并根据基于Agent的仿真的执行结构,提出了对基于Agent的仿真的计算结构、数据结构进行重构的方法,以适应异构的硬件架构。最后对基于多核CPU GPU的并行Agent仿真性能进行了实验分析。  相似文献   

2.
多GPU无合成绘制算法采用混合sort-first与sort-last的并行绘制模式,将绘制任务划分为多个子任务集合进行并行绘制并异步合成显示。原方法中对屏幕的分割方式过于平凡,未明确提出一种高效的屏幕分割策略,从无合成算法本身特性出发,提出一种自适应屏幕划分策略,该算法根据GPU数目及绘制分辨率参数,启发式计算屏幕初始划分方式,再采用统计性能反馈的方式动态选择最佳屏幕划分方式,较原有方法更易于实现子屏幕任务的负载平衡,实验表明,算法在带来很少额外计算开销的同时,能够有效平衡并行绘制任务负载,进一步发挥多GPU无合成并行绘制系统的绘制效率。  相似文献   

3.
传统常微分方程的并行求解方法主要包括面向任务的并行和面向方法的并行,但是这两种求解算法,只能利用CPU,或者只能面向同质形式的ODE(ordinary differential equations)簇,存在严重不足。以RIDC(revisionist integral deferred correction)算法为基础,设计了一种面向CPU、GPU多目标机的混合求解器,基于流水线形式求解微分方程组,实现了单个方程组的内部和不同方程组之间的并行计算,进而能够充分发挥GPU的多核优势,有利于计算节点内部的负载均衡。仿真实验验证了框架的效率、准确率和精准度。  相似文献   

4.
多核CPU-GPU异构平台下并行Agent仿真负载均衡方法   总被引:1,自引:0,他引:1  
多核中央处理器(central processing unit, CPU)图形处理器(graphic processing unit, GPU)异构平台为并行Agent仿真提供了一个新的硬件执行平台,而负载均衡方法是充分利用硬件计算资源、提高并行仿真运行性能的一个有效途径。针对多核CPU-GPU异构平台下并行Agent仿真的负载均衡问题,建立了面向多核CPU-GPU的并行Agent仿真多层负载分配模型,提出了基于带约束的k-means空间聚类算法的并行Agent仿真静态负载划分方法和动态负载均衡策略,并给出了划分子集间的可交互性判定,以过滤掉大量不会发生交互关系的Agent之间的交互判定计算。最后通过实验验证了本文提出方法的有效性。  相似文献   

5.
时域有限差分法(FDTD)求解电磁学中麦克斯韦方程组是科学与工程计算中一个非常重要的算法.通过对FDTD求解麦克斯韦旋度方程的直接时间域的分析,给出其基于多个GPU组成异构机群系统上的并行加运算法,用OpenCL、CUDA和MPI编程模型实现了并行程序.在目前的主流NVIDIA和ATI的GPU平台上,加速的并行FDTD程序相对CPU串行程序和8个CPU核的MPI并行程序,分别获得了超过8倍和1.5倍的加速,并在多个GPU卡上获得了接近线性加速的扩展性能.  相似文献   

6.
拥有高精度蒙皮和复杂骨骼绑定关系的骨骼动画,渲染时存在很大的性能瓶颈。以往研究采用GPU加速动画,但高端GPU成本过高,而中低端GPU的通用计算性能有时不如高端CPU。为充分挖掘算法在多核CPU上的执行性能,弥补中低端GPU通用计算性能的不足,提出了基于Open CL的针对指令和线程的新兴集成并行方案,并与基于SSE结合Open MP针对指令和线程的传统独立并行方案展开对比。实验结果表明,在多数CPU和多种复杂度的数据上,基于Open CL的新兴并行方案的性能明显高于基于SSE的传统并行方案,并且性能优势随着数据复杂度的增加而提升。  相似文献   

7.
一种高效的大规模三维地形遥感影像纹理映射方法   总被引:1,自引:0,他引:1  
针对大规模虚拟战场地理信息建模与绘制的需求,研究提出一种可充分发挥GPU和多CPU核微处理器处理能力的、高效的大规模三维地形遥感影像纹理映射方法.该方法直接利用GPU进行高效的纹理压缩解压,采用基于多CPU核微处理器的多线程并行调度策略,实现了视点相关的纹理数据的高效预取和调度,并根据等地理长度映射原理实现了单一精度的大规模遥感影像纹理数据在大规模LOD地形上的精确匹配.实验表明,此方法可有效提高大规模三维地理信息场景.绘制的速度,纹理和地形的匹配精度高,增强了三维地理信息漫游的真实感.  相似文献   

8.
序列比对是生物信息学中最基本、最重要的操作,通过序列比对可以发现生物序列中的功能、结构和进化的信息。BLAST算法是序列比对中应用广泛的算法之一。基于多核流处理器GPU和CPU的异构乎台,提出了BLAST算法构造单词表和单词匹配扩展的并行化实现方法。实验证明构造单词表的计算性能获得3倍以上的加速比;单词匹配扩展采用的混合并行方式可以获得7倍左右的加速比,内部并行方式可取得3~4倍的加速比。  相似文献   

9.
针对天线组阵合成系统对于宽带、高速、并行信号的实时合成需求,设计了基于图形处理器(graphic processing unit, GPU)的天线组阵信号时延补偿方法。首先,分析了典型的整数时延补偿方法在GPU平台上实现的可行性,设计了基于数据块重叠保留的整数时延补偿方法。然后,对比了典型的小数时延补偿方法的优劣,设计了适合于GPU并行加速的频域小数时延补偿方法。最后,对基于GPU的天线组阵信号时延补偿方法进行了实验验证。多次实验测试结果表明,在确保时延补偿正确性的基础上,基于GPU的时延补偿方法相比传统串行CPU时延补偿方法加速比提升了约18倍,采用基于GPU的时延补偿方法可实现对多天线信号的实时合成。  相似文献   

10.
针对舰船多资源约束、多项目并行建造条件下进度优化与管理能力的不足,提出了一套进度管理方法。首先,基于关键链理论给出了多资源约束下舰船多项目并行建造进度管理步骤。其次,构建了舰船多项目并行建造进度优化模型,可实现在优化并行项目总工期的过程中通过合理分配各种资源获取最佳项目实施组合。最后,设计了适合于舰船建造等大型复杂工程项目求解的混合优化算法,并通过算例验证了方法的实用性。  相似文献   

11.
基于PC集群并行图形绘制系统综述   总被引:3,自引:0,他引:3  
如何满足大规模数据集科学计算可视化、沉浸式虚拟现实和巨型场景绘制等应用领域都对计算机图形绘制能力的需求已经是计算机图形学领域亟需解决的问题。在高速网络互联并配有高性能3D图形卡的PC集群上构造并行图形绘制系统已经成为普遍的解决方案。根据几何图元归属判断的时机,并行图形绘制系统可分为Sort-first,Sort-middle和Sort-last。根据应用程序在集群节点间的分布,基于集群的并行图形绘制系统可分为Client-Server和Master-Slave两种系统模型。目前流行的基于PC集群并行图形绘制系统包括WireGL,Chromium,ScalableDisplayWall和AnyGL。  相似文献   

12.
一种基于现代GPU的大地形可视化算法   总被引:4,自引:0,他引:4  
潘宏伟  李辉  廖昌阊  曾安祥 《系统仿真学报》2007,19(14):3241-3244,3275
地形渲染在计算机游戏,飞行模拟和视景仿真等领域的应用越来越广泛,随着渲染场景复杂度的增加,每次需要绘制的地形数量也越来越庞大。同时,新一代的显卡绘制能力的不断增强,原有的许多地形渲染算法已经不能很好的满足用户需求。在总结现有算法的基础上,提出了一种基于现代GPU的地形渲染算法。该算法同样使用高程图作为地形数据,将地形分成很多小块,每次渲染时以块为单位,所有小块使用四叉树组织成一个层次化结构,不同层次的节点代表了不同细节层次的地形范围,并且采用了与Mipmap类似的细节简化方式,渲染时不需要对分块重新简化。为了保证CPU和GPU的负载平衡,将一些复用率高的地形分块缓存到显卡中,大大降低带宽需求。实验证明该算法可以更为充分利用图形处理器的加速能力,既能满足渲染精度要求也能达到一个较高的帧率。  相似文献   

13.
一种基于顶点纹理的LOD地形渲染算法   总被引:5,自引:0,他引:5  
Shader Mode 3.0引入的Vertex Shader Fetch是GPU可编程图形渲染技术发展的又一重要进展,基于该技术提出了一种新的地形渲染算法.算法主要特点是将地形高程数据组织成单通道纹理存放于显存,用于支持视点跟随的LOD地形渲染.绘制阶段,CPU端只需输入平坦的嵌套状的网格,GPU端首先根据当前视点参数计算该网格顶点的实际二维位置坐标,使用该坐标从地形纹理中采样出该顶点的高程值,这样平坦网格的顶点获取到实际的三维坐标值,图形渲染管线将继续处理直至输出显示.如此安排绘制流程可以彻底消减CPU计算负载,转而充分运用GPU高数据处理能力和可编程特性.实验表明,使用本算法绘制地形,效果逼真、绘制效率大大高于传统LOD地形绘制算法.  相似文献   

14.
高宇  邓宝松  吴玲达  杨冰 《系统仿真学报》2008,20(1):99-102,110
提出一种视点相关的连续多分辨率模型与可见性剔除相结合的复杂场景加速绘制算法。将复杂场景表示为场景图,然后自底向上构建场景的连续分层层次细节(CHLOD)模型;在实时绘制时,利用图形硬件的遮挡查询功能实现快速的层次遮挡剔除,并根据遮挡查询返回的可见象素数近似度量物体的可见性程度,通过与传统视点相关的细化准则相结合,实现了一种可见性驱动的场景连续多分辨率简化绘制方法,能够在保证场景绘制精度的同时进一步提高场景绘制的速度。  相似文献   

15.
大规模地形动态快速绘制技术研究   总被引:5,自引:0,他引:5  
大规模地形的快速绘制是目前的研究热点,如何有效地进行地形数据组织及模型简化,关系到渲染的速度和效果。为解决这个问题,结合现有算法提出了一种基于灵活简化准则的分块连续LOD模型构造算法,以及相应的模型预裁减调度绘制算法,将大规模地形转换为小块地形进行处理,并利用视点运动的连续性和前后帧的相关性,管理调度细节层次模型。实验结果表明,该算法有效地解决了绘制速度与质量之间的矛盾,较好地实现了大规模地形场景的实时快速漫游。  相似文献   

16.
大规模三维标量场并行可视化技术综述   总被引:1,自引:0,他引:1  
并行绘制是提高大规模三维标量场可视化效率的一种重要方法,分别对三维标量场的两类重要可视化方法面绘制方法和直接体绘制方法进行了阐述,并结合这两类可视化方法对其并行绘制中的各种并行模式、负载平衡和图像合成算法进行细致的分析和比较;对国内外较有名的并行绘制系统实现进行了分类与对比;最后,在总结现有研究成果基础上,分析了该领域的下一步发展趋势,为大规模性三维标量场的并行可视化提出了新的问题和思路。  相似文献   

17.
为了加速定价利率衍生产品的Monte Carlo模拟,对远期测度下Libor市场模型中的漂移项用确定性函数近似,构造了一个与原问题高度相关的控制变量. 然后将此控制变量算法移植到多核CPU和GPU的并行计算环境中,极大地提高了计算效率. 针对利率上限的数值结果表明选取的控制变量十分有效且稳健,多核CPU具有线性加速效果,GPU相对于单核CPU具有很大的计算优势,控制变量和并行计算结合得到的加速效果大致是两者的乘积. 结合控制变量和并行计算的方法可以为其他利率衍生产品如利率下限,互换期权的定价提供有效思路.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号