期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

秦洁张志敏《科学技术与工程》2014,14(13)

为了能够有效提高基于时域的SAR回波仿真的运行速度,本文提出了一种基于GPU架构的SAR回波仿真优化实现方法。该方法结合GPU的计算密度高、高度并行的特点并利用CUDA流在GPU上同时执行多个任务,实现任务并行、指令并行和数据并行的三重并行,极大地挖掘了回波模拟全过程的并行性,缩短了回波仿真的运算时间。实验结果表明,该方法相对于传统的CPU上的串行算法平均加速比达到128倍,可用于实时信号处理。相似文献

2.

使用GPU加速通用科学计算-CUDA技术解析

刘勇《科技信息》2008,(24)

GPU是图形加速卡的处理单元,具有大量的并行流水线,通常,其浮点运算能力是同代的CPU的10倍以上。本文介绍了一种尚在完善中的利用GPU强大的浮点运算能力来加速通用科学计算的编程模型CUDA。CUDA是用于GPU计算的开发环境,它是一个全新的软硬件架构,可以将GPU视为一个并行数据计算的设备,对所进行的计算进行分配和管理。相似文献

3.

基于GPU的多尺度Retinex图像增强算法实现

基于GPU的多尺度Retinex图像增强算法实现《山东科学》2017,30(3):103-109

为提高多尺度Retinex算法的实时性,本文提出了基于GPU的多尺度Retinex图像增强算法,通过对算法进行数据分析和并行性挖掘,将高斯滤波、卷积和对数差分等计算量非常耗时的模块放到GPU中,利用大规模并行线程处理来提高效率。在GeForce GTX 480和CUDA 5.5中进行实验,结果表明该算法能显著提高计算速度,且随着图像分辨率的增加,最大加速比达160倍。相似文献

4.

GPU加速的并行模拟退火算法在蛋白质预测中的应用

王丽美杨辉钟一文刘新泽《宁夏大学学报(自然科学版)》2015,(2):140-145

人类基因组测序工作初步结果显示,MSAPSO算法在求解蛋白质折叠问题时具有不错的求解精度,但是算法执行的时间开销却令人难以接受.针对此问题,使用CUDA编程模型在GPU上实现MSAPSO算法(CUMSA),利用GPU的计算能力,节省求解问题的时间成本.实验结果显示,CUMSA对4条测试序列求解得到的解的质量相对较高,由得到的解的构象图可知,CUMSA能够高效、正确地进行蛋白质折叠结构预测. 相似文献

5.

用GPU实现基于LSM算法的美式期权定价

蒋晓蓝《科技咨询导报》2013,(18):34-35

期权是金融领域中投资者用以进行套利和避险交易的一种衍生性金融工具.相对于CPU,GPU有着更好的并行处理能力和带宽优势,将其用于期权定价计算将极大地提高运算性能.本文以经典的美式期权定价模型的最小二乘蒙特卡洛方法为基础,提出了该算法基-GPU的一种实现.该文对一维期权合约的定价在CPU和GPU北进行了比较,来探索用GPU进行期权定价计算的优越性.测试结果表明,在保证相应的系统稳定性的前提下,针对不同的模拟次数和时间步数,GPU平台在运算性能上明显优于CPU平台. 相似文献

6.

基于GPU加速及改进谱FDTD方法的周期性结构分析

张波薛正辉任武李伟明盛新庆《北京理工大学学报》2011,31(10):1212-1216

为解决作为分析周期性结构的时域数值算法本身在计算单角度入射时依然存在效率偏低的这一问题,提出了一种改进的谱FDTD方法,并运用图形处理器(GPU)对算法进行硬件加速.改进的算法在保证单频点运算结果精确的前提下,通过降低单次运算对运算结果频谱分辨率的要求以降低总体的运算时间.算例验证表明,在保证同等精度的前提下,改进后的算法将单角度斜入射问题的计算效率提高了1倍以上,并在此基础上通过GPU硬件加速成功实现了20倍以上的加速比,这证明了GPU加速的改进谱FDTD法的可行性与高效性. 相似文献

7.

基于GPU 加速的边界面法正则积分的研究

张见明余列祥刘路平《湖南大学学报(自然科学版)》2013,40(3):41-45

基于GPU高性能并行计算,在CUDA编程环境中实现边界面法正则积分的并行加速.在NVIDIA GTX680GPU和英特尔(R)酷睿(TM)i7-3770KCPU的计算平台上与传统的正则单元积分对比.数值算例表明,在保证相同精度的前提下,加速比可达到8.3. 相似文献

8.

基于GPU和Python的粒子群优化算法研究

熊大卫胡建陈园《西南民族大学学报(自然科学版)》2023,(4):424-428

针对基于Python语言的粒子群优化算法利用GPU实现加速的空缺问题,提出一种基于GPU和Python的改进粒子群优化算法：以CUDA架构和Python的Numba库为工具,将算法中的粒子评价、个体历史最优解更新、粒子升级三个部分进行CUDA编程,CUDA核函数中每个线程按单个粒子并行调用,在默认流中完成计算.经4种测试函数实验验证,所提出的改进算法在维数和粒子数较小时运行速度不及粒子群优化算法,在维数和粒子数较大时加速效果明显,最优速度达到粒子群优化算法的3倍以上. 相似文献

9.

基于GPU交互式光线跟踪算法的设计与实现 总被引：1，自引：0，他引：1

陆建勇曹雪虹焦良葆《南京工程学院学报(自然科学版)》2009,7(3):61-67

由于GPU并行处理能力和可编程能力的提高,计算量巨大的光线跟踪算法在GPU上的实现成为研究热点．在CUDA平台上验证了Foley等人所采用的KD-tree加速算法,实现了交互式光线跟踪．在图像分辨率为512×512,跟踪深度为4时,针对复杂场薏的渲染速度达到15f／s,基本实现交互式光线跟踪．相似文献

10.

基于GPU的MIMO系统球形解码器设计

陈慕羿《科技资讯》2011,(18):13-13

图形处理单元(GPU)可作为低成本并行可编程协处理器,提供高的计算吞吐量,非常适于大规模系统设计和仿真。为充分利用了GPU的并行处理能力,以加速MIMO无线通信系统的仿真,针对平坦衰落信道,设计了用于MIMO无线通信系统的固定复杂度球形解码器,并根据GPU的架构与存储特点,对实现进行了优化,减小了数据存取延迟和访问冲突。仿真结果表明,球形解码速度可提高近10倍。相似文献

11.

基于GPU的数字信号处理中相关性计算的研究 总被引：1，自引：0，他引：1

索东高建瓴王恒《贵州大学学报(自然科学版)》2014,31(6):89-93

现代信号处理和通信系统对信号的处理,正变得越来越复杂并且计算也越来越密集,如何提高这些领域中信号处理的运算速度和运算精度已经成为当今一个重要的研究方向,GPU由于其特殊的结构,使其非常适合用于加速数据运算仿真和图形图像分析.本文提出一种基于GPU的信号相关性并行计算的方法,通过实验验证得出基于GPU的数字信号相关性的并行处理方法明显优于基于CPU下的处理方法,实验结果最高加速比达到了14.5倍,现代GPU技术的发展给通信信号处理领域带来新的途径. 相似文献

12.

探究GPU对神经网络的加速作用

朱永贵华敏杰张佳佳《中国传媒大学学报》2018,25(5)

相似文献

13.

基于GPU的并行拟牛顿神经网络训练算法设计

刘强李佳峻《河海大学学报(自然科学版)》2018,46(5):458-463

针对人工神经网络训练需要极强的计算能力和高效的最优解搜寻方法的问题,提出基于GPU的BFGS拟牛顿神经网络训练算法的并行实现。该并行实现将BFGS算法划分为不同的功能模块,针对不同模块特点采用混合的数据并行模式,充分利用GPU的处理和存储资源,取得较好的加速效果。试验结果显示:在复杂的神经网络结构下,基于GPU的并行神经网络的训练速度相比于基于CPU的实现方法最高提升了80倍;在微波器件的建模测试中,基于GPU的并行神经网络的速度相比于Neuro Modeler软件提升了430倍,训练误差在1%左右。相似文献

14.

基于CUDA的数控仿真加工面显示算法的研究

黄明艳王子牛《贵州大学学报(自然科学版)》2013,30(4)

利用CUDA并行计算框架和GPU高效的并行性和灵活的可编程性等特点,本文提出了数控仿真加工面并行显示算法,算法主要包括:并行式区间树索引遍历体素,对活跃体素的角点和边信息标记提取;体素标记与MC分类之间的映射匹配;将匹配结果对应的MC模型直接显示绘制.该基于GUDA框架的GPU并行算法,从理论上分析提高显示速度,降低计算时间,增大仿真的实时性. 相似文献

15.

基于GPU的可扩展哈希方法

胡学萱奚建清林妙《华南理工大学学报(自然科学版)》2015,43(1)

为了使用可扩展哈希表进行快速的数据访问,需要高效地更新索引以维护哈希表.文中提出了一种基于GPU的可扩展哈希算法g EHT.该算法充分利用GPU的并行计算能力,并采用表重用、预分裂技术,无锁地扩展和收缩表、插入和删除数据,实现了高并发地创建哈希表、更新索引和检索数据.实验结果表明,该算法的查询数据、维护哈希表和更新索引性能优于其他多核CPU的线性哈希及可扩展哈希算法,尤其是在高负载的情况下. 相似文献

16.

基于GPU的B-S模型下改进的Crank Nicolson算法

王文浩邬春学《上海理工大学学报》2013,35(2):147-151,156

针对Black-Scholes模型及其公式特点进行了理论分析与数学处理,给出了优化的Crank-Nicolson算法,提高了实际期权交易效率.通过使用GPU作为计算平台,结合CUDA架构技术,验证改进后算法的有效性和适用性.在CPU平台下进行横向测试,验证GPU平台运行环境优势.实验表明,改进后的算法在GPU平台下运行所提升的效果显著,运算精度和效率得到提高. 相似文献

17.

基于GPU的高阶辛FDTD算法的并行仿真研究 总被引：1，自引：0，他引：1

马巍巍孙冬吴先良孙兵兵《合肥工业大学学报(自然科学版)》2012,35(7):926-929

高阶辛时域有限差分算法(SFDTD)与传统的时域有限差分算法(FDTD)相比具有更优的稳定性和计算精度,但在进行电磁仿真时则更为耗时。为解决这一问题,文章应用SFDTD的空间并行性,研究并实现了基于计算统一设备架构(CUDA)的SFDTD的并行算法仿真;基于费米架构,分析了各种尺度网格下速度的提升,与传统的CPU实现该算法进行比较,验证了该方法的正确性和高速性。相似文献

18.

三角晶格Ising模型Monte Carlo模拟的GPU加速算法

陆星蔡静张伟《科学技术与工程》2012,12(4):731-734,739

在分析传统Monte Carlo算法的基础上,针对三角晶格Ising模型提出了一种基于GPU的并行模拟方法,大大提高了算法的效率。对1024?024的模型,实现了69倍的加速比。通过该算法所得数据分析模型的临界行为,获得了高精度的临界点βc = 0.27466(1)和临界指数yt =1.01(2),yh = 1.8756(3)。相似文献

19.

高效率FDTD网络并行计算研究

梁丹冯菊陈星《四川大学学报(自然科学版)》2006,43(3):549-554

在一套Beowulf型网络并行计算机系统上,对FDTD并行化处理中的区域分割、邻近子区域之间的边界数据交换、数组操作和进程同步等关键步骤进行了研究和优化,提出了采用MPI并行函数的FDTD并行计算方案.通过三维FDTD并行计算举例,验证了并行计算的正确性,通过测试得到了较高的并行效率. 相似文献

20.

基于CUDA平台的时域有限差分算法研究

沈琛王璐胡玉娟吴先良《合肥工业大学学报(自然科学版)》2012,35(5):644-647

文章针对传统时域有限差分(FDTD)算法的不足,以图形加速卡为核心,通过理论分析和数值模拟,研究并实现了基于CUDA平台的FDTD并行算法。CUDA是最新的可编程多线程的通用计算GPU模型,由于FDTD算法在空间上具有天然的并行性,因此非常适合在GPU上实现并行算。文章描述了在CUDA编程模型上的FDTD算法的设计以及优化过程,并通过数值仿真实验结果证明了基于GPU的并行FDTD算法可以大大减少计算时间,基于GPU加速已成为电磁场数值计算的研究热点之一。相似文献