首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 734 毫秒
1.
针对粒子滤波算法在重采样环节因粒子交互而不能充分并行处理的问题,提出了基于图形处理器(GPU)的并行骨干粒子群优化粒子滤波算法(BBPSO-PF).首先利用骨干粒子群算法具有易并行的特点优化粒子滤波算法重采样环节,从算法结构上提高粒子滤波算法的并行度.然后利用GPU的多线程架构并行处理每个粒子群的数据,每个线程负责一个粒子群,使粒子群之间得到并行化处理,解决粒子滤波重采样因粒子交互而不能充分并行的缺点.最后利用GPU中对齐与合并的内存访问原则,给粒子群设计高效的数据存储结构,降低内存访问事务,提高粒子群的数据存取速度,进一步提高算法实时性.该方法在保证算法精度前提下明显提高了算法的实时性.  相似文献   

2.
为降低粒子群优化算法(PSO: Particle Swarm Optimization)时间和空间的复杂度随问题规模的增大而越来越高的问题, 对图形处理器(GPU: Graphic Processing Unit)用于并行计算的方法进行了分析, 利用GPU的并行特性, 实现了粒子群优化算法路径搜索过程的并行化。测试函数实验结果证明, GPU平台较CPU模式下的计算, 其搜索速率有明显提高。  相似文献   

3.
针对大地电磁粒子群反演算法存在的计算时间过长的问题,基于自适应粒子群优化和消息传递接口提出一种新的大地电磁并行反演算法.在曙光4000L大型机平台上,利用该并行反演算法进行一维大地电磁层状介质反演实验,实验结果表明,新的并行反演算法能有效解决大地电磁粒子群反演计算时间过长的问题.  相似文献   

4.
基于OpenMP求解无容量设施选址问题的并行PSO算法   总被引:2,自引:1,他引:1  
讨论无容量设施选址(UFL)问题,提出了一个基于OpenMP技术的并行多粒子群优化(PSO)算法.将整个种群分为若干子种群,同时利用局部信息来更新粒子速度,使得并行算法异步进行.算法运行一定代数后,每个子种群都会与其相邻种群交换最优粒子.通过将并行多粒子群算法对OR-library中的标准测试问题进行测试,并将计算结果与串行多粒子群算法的计算结果进行比较.相比之下,并行多粒子群算法执行时间短,特别对于大规模的计算问题,所得结果有更好的鲁棒性.  相似文献   

5.
在已有的并行粒子群优化算法的基础上,结合遗传算法,并利用Java语言支持多线程特点,开发出单子群、k子群、任意子群三种遗传并行粒子群优化算法.通过对6个Benchmark测试函数的测试分析,表明这三种算法都具有运行速度快,求解质量高的特点.  相似文献   

6.
支持向量机(support vector machine,SVM)的参数选择对其性能有着重要的影响,使用穷举法优化参数需要大量的计算时间.为快速寻找最优参数组合,利用粒子群算法(particle swarm optimization,PSO)收敛速度快、简单易行等特点,将SVM参数作为粒子的解决方案.并利用图形处理器(graphics processing unit,GPU)并行化处理能力计算每个参数的分类准确率,从而提升了在一定的搜索空间内寻找最佳参数组合的计算速度.对UCI数据进行实验,对比结果显示,该方法能快速有效地获取优化结果.  相似文献   

7.
为提高粒子群优化算法在优化问题中的效率,本文提出了并行粒子群优化算法(BLP-SO).基本思想是并行机制 最佳粒子共享 分层搜索.主要工作包括(1)信息共享机制中引入了区域学习,使粒子更新能参考其他粒子的信息;(2)提出了粒子群两层划分模型,底层利于扩大搜索范围,上层利于全局精细搜索;(3)证明了关于粒子群和并行粒子群收敛性定理;(4)在4个基准函数上的优化实验表明,新方法比经典的IPPSO并行粒子群算法在解的精度上提高了51.93%到96.10%.  相似文献   

8.
基于GPU的SVM参数优化并行算法   总被引:1,自引:0,他引:1  
为了缩短支持向量机(support vector machine,SVM)参数优化时长,提高SVM参数优化的效率,提出了基于图形处理单元(graphic processing unit,GPU)的SVM参数优化并行算法.分析了基于网格搜索和粒子群优化算法的并行特性,基于GPU设计了该优化算法的并行化方案,并在单GeForce GT 650M GPU卡上进行了试验验证.结果表明,并行化网格搜索和并行化粒子群参数优化算法不仅可以取得与非并行化参数优化算法相同的优化效果,而且执行时间大大减小,其中并行粒子群参数优化算法的加速比可高达26.85,大幅提升了SVM的参数优化效率.  相似文献   

9.
为进一步提高粒子群优化算法的搜索性能,在分析不同拓扑结构对算法性能影响的基础上,针对不同拓扑结构粒子群优化算法的优缺点,提出一种混合使用全局版本和局部版本粒子群优化算法的方法,每一代粒子在速度更新时随机选择全局模型或局部模型方式进行.在典型测试函数上进行对比实验,结果验证了新算法不仅能有效地进行全局搜索,而且具有更好的收敛精度.  相似文献   

10.
在已有的并行粒子群优化算法的基础上,结合遗传算法,并利用Java语言支持多线程特点,开发出单子群、k子群、任意子群三种遗传并行粒子群优化算法。通过对6个Benchmark测试函数的测试分析,表明这三种算法都具有运行速度快,求解质量高的特点。  相似文献   

11.
针对信息处理中常见的字符串匹配问题,通过对经典的Brute Force算法和KnuthMorris-Pratt算法进行分析,根据GPU异构并行计算任务的分配特性,设计一种针对Knuth-Morris-Pratt算法的数据重叠划分并行方案,并提出一种基于移动平台的异构并行字符串匹配算法KMP_MOP.在PowerVR移动平台环境下使用千万级长度的字符串数据对算法的性能进行测试,同时对算法在其他平台的执行情况进行比较,验证了并行算法的性能可移植性.实验结果表明,KMP_MOP算法能充分利用移动平台中的GPU性能,有效提高具有GPU的移动平台设备的字符串匹配效率.  相似文献   

12.
基于CUDA的高速并行高斯滤波算法   总被引:2,自引:1,他引:1  
为加快表面三维形貌分析中高斯滤波算法的执行速度,提出了一种基于计算统一设备构架(CUDA)的高斯滤波算法来实现高速并行处理.分析高斯滤波算法原理和CUDA并行计算体系,将CUDA并行计算技术引入到表面分析领域.针对高斯滤波数据间依赖性弱和CUDA采用单指令多线程(SIMT)执行模型的特点,总结出适合于CUDA的并行高斯滤波算法流程.实验证明:该方法与CPU串行处理方法相比,其加速比达到40倍以上,可以有效提高数据处理能力.  相似文献   

13.
基于GPU并行算法的水动力数学模型建立及其效率分析   总被引:1,自引:0,他引:1  
应用非结构化网格建立水动力模型目前已经得到了广泛的应用.针对在网格数过多,且无集群机情况下难以快速获得计算结果这一问题,基于GPU的高性能计算技术,在CUDA开发平台下设计并行算法,建立非结构化网格的二维水动力模型.与利用GTX460显卡和集群机的计算效率对比表明,在保持计算精度的前提下,速度提升了一个量级,且随着网格数的持续递增,可以保持较高的加速比增幅,比较适合应用于大范围海域的水动力模型的数值计算.  相似文献   

14.
基于CUDA平台的时域有限差分算法研究   总被引:1,自引:1,他引:0  
文章针对传统时域有限差分(FDTD)算法的不足,以图形加速卡为核心,通过理论分析和数值模拟,研究并实现了基于CUDA平台的FDTD并行算法。CUDA是最新的可编程多线程的通用计算GPU模型,由于FDTD算法在空间上具有天然的并行性,因此非常适合在GPU上实现并行算。文章描述了在CUDA编程模型上的FDTD算法的设计以及优化过程,并通过数值仿真实验结果证明了基于GPU的并行FDTD算法可以大大减少计算时间,基于GPU加速已成为电磁场数值计算的研究热点之一。  相似文献   

15.
 在医学超声成像系统中由于超声波在人体组织内传播会发生衰减,需要对超声图像进行有效的增益补偿,使超声图像的显示效果更好。但大多数自动增益补偿算法在处理时涉及大量的复杂计算,成为临床实时成像系统中的一大性能提升瓶颈,为此提出了一种基于高性能并行计算平台Fermi架构图形处理单元(GPU)的自动增益补偿并行处理算法。本算法主要的处理流程有数据预处理、区域类型检测、组织强度计算、二次曲面拟合以及自适应增益补偿等部分,核心的并行算法设计包括了粗粒度的并行均值滤波、局部方差系数的并行计算、优化的矩阵转置并行实现以及基于LU分解的粗粒度的矩阵求逆的并行实现等方面。数据测试结果显示,与基于CPU的实现相比,采用Fermi架构的GPU处理不仅可以得到完全一致和较好的增益补偿效果,而且可以取得较大的加速效果,满足实时系统需求,对512×261的图像数据能够达到427帧/s的高帧率,速度提高了大约267倍。  相似文献   

16.
开发了基于图形处理器(GPU)的Cholesky分解并行算法,应用于模态计算程序中,对计算进行加速.算例测试表明该算法相对串行算法计算性能大幅提升,且加速比随矩阵阶数增加而增加,与串行程序相比加速比可达到19.6,此时GPU浮点运算能力达到298Gflops.GPU程序固有频率计算结果与Abaqus计算结果的误差在2%以内,具有足够的计算精度.  相似文献   

17.
提出一种基于统一计算设备架构(CUDA)加速的尺度不变特征变换(SIFT)快速计算方法,用以解决SIFT特征提取计算过程耗时过长的问题.该方法充分利用图像处理单元(GPU)在并行计算、浮点计算、内存管理等方面的优势,合理分配主机端和设备端的资源及其在SIFT特征计算中所承担的角色.实验表明,与CPU架构下的SIFT特征提取算法相比,本文算法可以大幅度加快SIFT特征提取的计算速度,其加速比随着SIFT特征点数目的增加而增加,在本文实验中最大加速比可达1954.  相似文献   

18.
随着图像数据量的增加,传统单核处理器或多处理器结构的计算方式已无法满足图像灰度化实时处理需求.该文利用图像处理器(GPU)在异构并行计算的优势,提出了基于开放式计算语言(OpenCL)的图像灰度化并行算法.通过分析加权平均图像灰度化数据处理的并行性,对任务进行了层次化分解,设计了2级并行的并行算法并映射到“CPU+GPU”异构计算平台上.实验结果显示:图像灰度化并行算法在OpenCL架构下NVIDIA GPU计算平台上相比串行算法、多核CPU并行算法和CUDA并行算法的性能分别获得了27.04倍、4.96倍和1.21倍的加速比.该文提出的并行优化方法的有效性和性能可移植性得到了验证.  相似文献   

19.
针对减少模拟计算时间及提高问题求解规模问题, 基于设备编程架构(CUDA)将使用预处理的稳定双共轭梯度法在图形处理器(GPU)上实现, 并将其整合到TOUGHREACT软件中, 在GPU平台实现了对地下多相流动数值模拟问题的并行求解, 并给出了稳定共轭梯度算法中最耗时的两个操作稀疏矩阵向量乘积和向量内积计算的GPU平台实现及优化方法. 实验结果表明, GPU的使用对求解过程有良好的加速效果, 针对不同的网格规模进行多相流模拟实验, 达到了1.7~3.4倍的加速比.  相似文献   

20.
矩量法(MOM)是求解电磁场散射和辐射问题的一种常用数值方法,当未知量数目比较大时,其计算需要大量的时间开销.引入计算统一设备架构(CUDA)技术,在图形处理器(GPU)上实现并行MOM,并且与传统的中央处理器(CPU)串行计算比较,验证GPU计算结果的准确性.在未知量数目不同时,分析MOM中的阻抗矩阵填充和共轭梯度(CG)迭代法的加速情况.当未知量数目较大时,计算速度与CPU相比可提升数十倍.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号