首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
开发了基于图形处理器(GPU)的Cholesky分解并行算法,应用于模态计算程序中,对计算进行加速.算例测试表明该算法相对串行算法计算性能大幅提升,且加速比随矩阵阶数增加而增加,与串行程序相比加速比可达到19.6,此时GPU浮点运算能力达到298Gflops.GPU程序固有频率计算结果与Abaqus计算结果的误差在2%以内,具有足够的计算精度.  相似文献   

2.
基于GPU的粒子滤波并行算法   总被引:1,自引:1,他引:0  
针对粒子滤波跟踪算法计算量较大,需要在跟踪准确性与计算效率之间做出妥协的问题,分析了粒子滤波算法的并行性,提出了基于图像处理单元(GPU)平台的粒子滤波并行算法.将传统粒子滤波算法与GPU有效结合起来,充分利用GPU并行运算的性能,加快粒子滤波算法的计算速度.对所提出算法的计算性能与普通串行算法进行了对比,实验结果表明该算法在不降低跟踪准确性的同时,平均每帧处理时间显著减少.  相似文献   

3.
分析了K-means算法在GPU上实现并行计算的可能性,并在GTX8800 GT显卡上实现,研究了GPU的存储访问机制,在对数据进行合理组织基础上对算法进行改进,避免了存储体冲突的产生,提高了算法的健壮性.研究结果证明该方法在GPU上的并行运算速度明显快于CPU,加速比高.  相似文献   

4.
基于GPU的SVM参数优化并行算法   总被引:1,自引:0,他引:1  
为了缩短支持向量机(support vector machine,SVM)参数优化时长,提高SVM参数优化的效率,提出了基于图形处理单元(graphic processing unit,GPU)的SVM参数优化并行算法.分析了基于网格搜索和粒子群优化算法的并行特性,基于GPU设计了该优化算法的并行化方案,并在单GeForce GT 650M GPU卡上进行了试验验证.结果表明,并行化网格搜索和并行化粒子群参数优化算法不仅可以取得与非并行化参数优化算法相同的优化效果,而且执行时间大大减小,其中并行粒子群参数优化算法的加速比可高达26.85,大幅提升了SVM的参数优化效率.  相似文献   

5.
针对最短路径算法处理大规模数据集低效的问题,提出了基于图形处理器(Graphics Processing Unit,GPU)加速的全源对最短路径并行算法.首先通过优化矩阵乘法算法实现了在工作组内和组间进行并行运算数据,然后减少了非规则行造成的工作项分支,最后降低了工作项对邻接矩阵计算条带存储资源的访问延时.实验结果表明,与基于AMD Ryzen5 1600X CPU的串行算法、基于开放多处理(Open Multi-Processing, OpenMP)并行算法和基于统一计算设备架构(Compute Unified Device Architecture, CUDA)并行算法相比,最短路径并行算法在开放式计算语言(Open Computing Language, OpenCL)架构下NVIDIA GeForce GTX 1 070计算平台上分别获得了196.35、36.76和2.25倍的加速比,验证了提出的并行优化方法的有效性和性能可移植性.  相似文献   

6.
随着计算机技术的更新发展,人们需要处理各式各样复杂的图像,而图像处理的方式方法也表现出多元化特性,对此,该文基于GPU并行处理能力,提出了一种更加高效、快捷的图像处理方法,通过C++语言进行图像计算,主要从高斯模糊算法并行化、彩色负片处理算法并行化、透明合并处理算法并行化3个方面做了全面分析,从而证明GPU视角下的图像处理并行算法更具优势,值得大力推广与应用。  相似文献   

7.
为了在GPU上实现允许k-差别近似串匹配并行算法,并进一步提高在GPU上的算法性能,在综合考虑GPU的存储层次前提下,采取了多种访存优化措施,并提出了避免bank冲突的解决方案.测试结果表明,所用优化措施及方案使算法性能明显提高.  相似文献   

8.
基于GPU并行算法的水动力数学模型建立及其效率分析   总被引:1,自引:0,他引:1  
应用非结构化网格建立水动力模型目前已经得到了广泛的应用.针对在网格数过多,且无集群机情况下难以快速获得计算结果这一问题,基于GPU的高性能计算技术,在CUDA开发平台下设计并行算法,建立非结构化网格的二维水动力模型.与利用GTX460显卡和集群机的计算效率对比表明,在保持计算精度的前提下,速度提升了一个量级,且随着网格数的持续递增,可以保持较高的加速比增幅,比较适合应用于大范围海域的水动力模型的数值计算.  相似文献   

9.
对基于统一计算设备架构(CUDA)的图形处理器(GPU)在图形处理方面的算法进行了研究和实现.针对目前图像处理算法日益复杂,性能要求越来越高,而传统的基于CPU的图像处理算法无法满足需求的情况,充分利用GPU突出的并行处理能力,采用CUDA技术,利用C++语言实现了图像处理算法.研究并设计了高斯模糊处理算法、彩色负片处理算法、透明合并处理算法的GPU并行运算流程,与CPU的性能对比表明基于GPU图像处理算法的效率更高.  相似文献   

10.
针对大数据量导致模板匹配目标识别算法计算时间长,难以满足快速检测的实际需求问题,在采用最新NVIDIA Tesla GPU构建的CPU+GPU异构平台上,设计了一种模板匹配目标识别并行算法.通过对模板图像数据常量化、输入图像数据极致流多处理器片上化和简化定位参数计算3方面优化了并行算法,并对算法进行性能测试.实验表明,该算法在保证识别效果的同时实时性明显提高.  相似文献   

11.
通过研究经典GaBP算法,实现了同步和异步GaBP算法程序设计和计算实验,并对结果进行了系统的分析。实验表明GaBP优化算法——异步GaBP算法比经典GaBP算法有更好的计算效率。  相似文献   

12.
刘宁  姜学军 《科技信息》2010,(32):257-257,261
小波变换用于图像压缩就是把图像进行多分辨率分解,分解成不同空间、不同频率的子图像。图像经过小波变换后被分割成不同频带,低频子带采用DPCM(差分脉冲调制)方法进行无损压缩,保证图像主要信息不丢失,其他于带采用改进的SPIHT(多级树集合分裂算法)编码方法提高压缩比,这样为算法的并行实现提供了可能。实验证明图像压缩的并行处理可以获得较小的时间开销。  相似文献   

13.
该文介绍了GPU概念及发展、并行计算的概念以及与串行计算相比而具有的优势,指出智能优化算法具有天然的并行性和分布性,在基础理论和工程应用中具有很高的研究价值,该文对智能优化算法中的模拟退火算法、遗传算法、禁忌搜索算法、人工神经网络算法及蚁群算法的原理和实际应用进行了深入研究,提出了基于GPU的并行优化算法。  相似文献   

14.
为了模拟企业工作流的业务流程,实现企业业务过程的自动执行和监控,提出了一种新的工作流Petri网模型及其并行算法。(1)根据工作流系统和Petri网模型的特点,给出了工作流模型与Petri网的映射关系;(2)对基于Petri网模型的四种工作流网基本模型进行并行性分析,提出了一种新的工作流Petri网并行模型;(3)结合Petri网并行划分算法和新的模型进行融合与优化,提出一种新的工作流并行优化算法;(4)以应用实例对工作流并行优化算法进行验算与分析。结果表明,新的工作流Petri网模型及其并行算法可行有效。  相似文献   

15.
基于分布式并行处理技术和面向对象的建模理论,为解决大规模城市道路交通流模拟问题,提出分布式并行模拟动态交通流分配思想,给出了CybeTraffic三维仿真系统中交通流模拟系统的数据结构描述、系统设计框架以及系统模拟结果.  相似文献   

16.
对强激光与等离子体相互作用三维数值模拟程序LARED_P数据输出进行分析,针对大规模数据模拟数据的特点,提出了基于BP神经网络的并行算法,即在各个搜索子空间内对训练集合中的学习样本进行并行训练。实例表明:不仅可避免陷入局部极小点,提高网络训练速度,而且仿真效果较好。  相似文献   

17.
封闭立方体计算的主要任务是在生成一个数据单元时,判断其是否封闭。针对该问题,C-Cubing是新近提出的一种有效的方法,不同以往基于输出或基于元组的方法,它仅通过特定的度量,即封闭性度量,就可以判断出封闭单元。然而随着数据量的增加,C-Cubing的性能下降,因此它的并行算法还有待研究。本文提出基于MapReduce并行框架,采用C-Cubing对封闭立方体并行计算的方法,并在Hadoop上给予了实现。实验结果表明,本方案能够利用廉价的PC机器,有效提高了在较大数据集上计算封闭立方体的性能。  相似文献   

18.
随着图像数据量的增加,传统单核处理器或多处理器结构的计算方式已无法满足图像灰度化实时处理需求.该文利用图像处理器(GPU)在异构并行计算的优势,提出了基于开放式计算语言(OpenCL)的图像灰度化并行算法.通过分析加权平均图像灰度化数据处理的并行性,对任务进行了层次化分解,设计了2级并行的并行算法并映射到"CPU+GPU"异构计算平台上.实验结果显示:图像灰度化并行算法在OpenCL架构下NVIDIA GPU计算平台上相比串行算法、多核CPU并行算法和CUDA并行算法的性能分别获得了27.04倍、4.96倍和1.21倍的加速比.该文提出的并行优化方法的有效性和性能可移植性得到了验证.  相似文献   

19.
杨新强 《科技信息》2010,(31):I0053-I0053,I0418
GPU(Graphic Processing Unit),即图形处理器是英伟达公司首先提出来的一个概念。其初始目的是用来进行图形渲染,并不是为了进行通用计算。近年来,图形处理器(GPU)的发展日益成熟,随着CUDA(Compute Unified Device Architecture)构架的推出,GPU的应用范围不在局限于计算机图形学本身,扩展到各个领域。FDTD(Finite Difference Time Domain)的计算过程可以很容易的划分为多个子计算过程,而子计算过程之间同时进行着相似的计算,...  相似文献   

20.
粒子系统一直是模拟喷泉特效最常用的方法,但是当喷泉规模较大时,每一帧都要计算大量的粒子属性,使喷泉的模拟很难达到实时。针对以上问题,本文提出了基于GPU加速的粒子系统喷泉模拟方法,充分发挥GPU强大的运算能力,并与CPU配合以弥补GPU的不足,大大的提高了粒子系统的运行速度,使几百万数量的喷泉粒子能够实时绘制。同时本文还提出了喷泉水雾的生成方法,使喷泉效果更加逼真。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号