首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
为了能够有效提高基于时域的SAR回波仿真的运行速度,本文提出了一种基于GPU架构的SAR回波仿真优化实现方法。该方法结合GPU的计算密度高、高度并行的特点并利用CUDA流在GPU上同时执行多个任务,实现任务并行、指令并行和数据并行的三重并行,极大地挖掘了回波模拟全过程的并行性,缩短了回波仿真的运算时间。实验结果表明,该方法相对于传统的CPU上的串行算法平均加速比达到128倍,可用于实时信号处理。  相似文献   

2.
基于GPU的数字信号处理中相关性计算的研究   总被引:1,自引:0,他引:1  
现代信号处理和通信系统对信号的处理,正变得越来越复杂并且计算也越来越密集,如何提高这些领域中信号处理的运算速度和运算精度已经成为当今一个重要的研究方向,GPU由于其特殊的结构,使其非常适合用于加速数据运算仿真和图形图像分析.本文提出一种基于GPU的信号相关性并行计算的方法,通过实验验证得出基于GPU的数字信号相关性的并行处理方法明显优于基于CPU下的处理方法,实验结果最高加速比达到了14.5倍,现代GPU技术的发展给通信信号处理领域带来新的途径.  相似文献   

3.
采用离散元素法(discrete element method, DEM)进行颗粒系统运动仿真时,其模拟计算量大、计算效率低下,所采用的传统中央处理器(central processing unit, CPU)并行计算模型难以实现较大规模模拟。文章提出了一种基于图形处理单元(graphics processing unit, GPU)和统一计算设备架构(compute unified device architecture, CUDA)的并行计算方法;以球磨机的介质运动仿真为例,利用DEM方法结合CUDA并行计算模型,充分利用GPU众核多线程的计算优势,同时将颗粒属性信息存入GPU的常量存储器,减少信息读取的时滞,将筒体和衬板视为圆柱面和平面,简化了筒体与颗粒的接触判断,实现每个线程处理1个颗粒的相关计算,大幅提高计算速度;对颗粒堆积、筒体内2种尺寸颗粒运动进行仿真,并与基于CPU并行计算的结果进行对比。研究结果表明:在同等价格的硬件条件下,该文的方法可以实现10倍以上的加速比;对于含有复杂几何模型的仿真,如多尺寸颗粒和带衬板筒体的仿真,加速比会减少,但仍然可以实现数倍的加速。  相似文献   

4.
在CPU串行运算模式下实现大规模矩阵求逆是一个非常耗时的过程。为了解决这一问题,基于NVIDIA公司专为GPU(图形处理器)提供的CUDA(计算统一设备架构),从新的编程角度出发,利用GPU多线程并行处理技术,将矩阵求逆过程中大量的数据实现并行运算,从而获得了较大的加速比。同时,根据程序的执行结果,分析了GPU的单精度与双精度的浮点运算能力及其优、劣势。最后,通过分析数据传输时间对GPU性能的影响,总结出适合GPU的算法特征。  相似文献   

5.
杨新强 《科技信息》2010,(31):I0053-I0053,I0418
GPU(Graphic Processing Unit),即图形处理器是英伟达公司首先提出来的一个概念。其初始目的是用来进行图形渲染,并不是为了进行通用计算。近年来,图形处理器(GPU)的发展日益成熟,随着CUDA(Compute Unified Device Architecture)构架的推出,GPU的应用范围不在局限于计算机图形学本身,扩展到各个领域。FDTD(Finite Difference Time Domain)的计算过程可以很容易的划分为多个子计算过程,而子计算过程之间同时进行着相似的计算,...  相似文献   

6.
矩量法(MOM)是求解电磁场散射和辐射问题的一种常用数值方法,当未知量数目比较大时,其计算需要大量的时间开销.引入计算统一设备架构(CUDA)技术,在图形处理器(GPU)上实现并行MOM,并且与传统的中央处理器(CPU)串行计算比较,验证GPU计算结果的准确性.在未知量数目不同时,分析MOM中的阻抗矩阵填充和共轭梯度(CG)迭代法的加速情况.当未知量数目较大时,计算速度与CPU相比可提升数十倍.  相似文献   

7.
近年来,深层神经网络(deep neural network,DNN)被成功应用于语音识别领域,成为一种很具发展潜力的语音识别模型。然而,由于其训练算法复杂度高,随着训练数据和网络规模增大,DNN模型训练将非常耗时。为提高DNN的训练效率,该文研究了基于多图形处理器(graph-ic processing unit,GPU)的DNN快速训练算法。在TIMIT数据集上的音素识别实验显示:在基本保证识别性能的前提下,优化后的DNN快速训练方法在4个GPU下训练速度相比单GPU有约3.3倍的提升。实验结果表明该快速训练方法可以显著提升DNN模型的训练速度。  相似文献   

8.
期权是金融领域中投资者用以进行套利和避险交易的一种衍生性金融工具.相对于CPU,GPU有着更好的并行处理能力和带宽优势,将其用于期权定价计算将极大地提高运算性能.本文以经典的美式期权定价模型的最小二乘蒙特卡洛方法为基础,提出了该算法基-GPU的一种实现.该文对一维期权合约的定价在CPU和GPU北进行了比较,来探索用GPU进行期权定价计算的优越性.测试结果表明,在保证相应的系统稳定性的前提下,针对不同的模拟次数和时间步数,GPU平台在运算性能上明显优于CPU平台.  相似文献   

9.
面向CPU+GPU异构计算的SIFT   总被引:1,自引:0,他引:1  
依据图形处理器(GPU)计算特点和任务划分的特点,提出主从模型的CPU+GPU异构计算的处理模式.通过分析和定义问题中的并行化数据结构,描述计算任务到统一计算设备架构(CUDA)的映射机制,把问题或算法划分成多个子任务,并对划分的子任务给出合理的调度算法.结果表明,在GeForce GTX 285上实现的尺度不变特征变换(SIFT)并行算法相比CPU上的串行算法速度提升了近30倍.  相似文献   

10.
针对基于Python语言的粒子群优化算法利用GPU实现加速的空缺问题,提出一种基于GPU和Python的改进粒子群优化算法:以CUDA架构和Python的Numba库为工具,将算法中的粒子评价、个体历史最优解更新、粒子升级三个部分进行CUDA编程,CUDA核函数中每个线程按单个粒子并行调用,在默认流中完成计算.经4种测试函数实验验证,所提出的改进算法在维数和粒子数较小时运行速度不及粒子群优化算法,在维数和粒子数较大时加速效果明显,最优速度达到粒子群优化算法的3倍以上.  相似文献   

11.
基于RBF神经网络的变压器故障诊断及MATLAB仿真研究   总被引:1,自引:0,他引:1  
研究应用RBF神经网络进行变压器故障诊断,以提高变压器故障诊断率。分析了径向基函数神经网络的结构和工作原理,设计一个诊断变压器故障的三层径向基网络。通过采用MATLAB进行仿真实验,结果表明RBF神经网络是一很强的分类器,能够有效的对变压器故障进行诊断。  相似文献   

12.
对一类经典的Lotka-volterra系统两种群动力学模型进行了Matlab仿真,综合分析和对比三种不同的仿真手段,为检验和预测两种群动力学模型的渐近行为提供了新的思路和方法.  相似文献   

13.
海面的仿真研究不仅在计算机图形学领域具有重要的意义,同时对于水力学、流体力学、波动力学、海洋学等都具有重要的实际意义.本文采用基于海洋统计和经验的模型,该模型采用大量正弦波的叠加来模拟海面,通过FFT合成一个类似海浪谱分布的高度场;通过实时纹理映射技术实现水面的反射和折射,从而增强水波动画的真实感;充分利用图形处理单元(Graphics Processing Unit,GPU)提供的可编程特性及强大的计算能力,用GPU来提高水面绘制速度,实现海面实时绘制.  相似文献   

14.
基于MATLAB环境的阿贝-波特空间滤波实验仿真   总被引:1,自引:1,他引:1  
在介绍阿贝-波特空间滤波实验原理基础上,给出了实验仿真中几个关键的数字图像处理函数,讨论了低通、高通、带通等滤波实验的仿真实现,仿真结果表明,此方式能较好地完成了滤波成像仿真,是计算机辅助实验的一个可行途径。  相似文献   

15.
基于MATLAB/Simulink转速闭环直流调速控制系统的仿真研究   总被引:2,自引:0,他引:2  
以转速闭环调速系统为控制对象,采用MATLAB/SIMULINK平台建立系统的仿真模型,通过改变额定转速值和放大倍数的大小,来分析直流调速系统的转速和转矩响应过程。仿真结果表明:在参数改变的情况下,转矩和转速响应的快速性、平稳性、稳定性都比较好,整个系统的参数设计满足要求。  相似文献   

16.
粒子系统一直是模拟喷泉特效最常用的方法,但是当喷泉规模较大时,每一帧都要计算大量的粒子属性,使喷泉的模拟很难达到实时。针对以上问题,本文提出了基于GPU加速的粒子系统喷泉模拟方法,充分发挥GPU强大的运算能力,并与CPU配合以弥补GPU的不足,大大的提高了粒子系统的运行速度,使几百万数量的喷泉粒子能够实时绘制。同时本文还提出了喷泉水雾的生成方法,使喷泉效果更加逼真。  相似文献   

17.
基于MATLAB的某一森林灭火弹外弹道仿真与运用   总被引:1,自引:0,他引:1  
为了在设计初期能得到满足射程与弹重要求的弹丸初速,建立了弹丸质心运动的外弹道数学模型,采用四阶龙格-库塔法对外弹道微分方程进行计算,利用MATLAB软件进行仿真,并给出了相应的仿真结果及分析。最后根据得出的初速完成发射平台的原理方案设计,为后续的具体设计提供了依据。  相似文献   

18.
基于GPU的高阶辛FDTD算法的并行仿真研究   总被引:1,自引:0,他引:1  
高阶辛时域有限差分算法(SFDTD)与传统的时域有限差分算法(FDTD)相比具有更优的稳定性和计算精度,但在进行电磁仿真时则更为耗时。为解决这一问题,文章应用SFDTD的空间并行性,研究并实现了基于计算统一设备架构(CUDA)的SFDTD的并行算法仿真;基于费米架构,分析了各种尺度网格下速度的提升,与传统的CPU实现该算法进行比较,验证了该方法的正确性和高速性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号