首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 258 毫秒
1.
基于MMAS的机器人路径规划   总被引:3,自引:1,他引:2  
文章针对移动机器人系统在复杂环境中搜索目标和寻求最短路径问题,介绍了一种基于MMAS的机器人路径规划新方法;在MMAS算法的信息素更新中,采用了最大-最小蚂蚁系统的思想动态调整信息素,加强了正反馈的效果,同时周游最优蚂蚁和全局最优蚂蚁路径信息的动态更新,在一定程度上增加了解的多样性,也提高了蚂蚁的搜索效率;在搜索过程中,采取随机搜索与重点搜索相结合的方式对路径进行搜索,有利于加快搜索较好的解,而动态调整各项参数后,陷入局部解的可能性大大减少,并且可以找到最优解;最后通过仿真证明了该算法的有效性.  相似文献   

2.
基于GPU的SVM参数优化并行算法   总被引:1,自引:0,他引:1  
为了缩短支持向量机(support vector machine,SVM)参数优化时长,提高SVM参数优化的效率,提出了基于图形处理单元(graphic processing unit,GPU)的SVM参数优化并行算法.分析了基于网格搜索和粒子群优化算法的并行特性,基于GPU设计了该优化算法的并行化方案,并在单GeForce GT 650M GPU卡上进行了试验验证.结果表明,并行化网格搜索和并行化粒子群参数优化算法不仅可以取得与非并行化参数优化算法相同的优化效果,而且执行时间大大减小,其中并行粒子群参数优化算法的加速比可高达26.85,大幅提升了SVM的参数优化效率.  相似文献   

3.
基于CMP的多种并行蚁群算法及比较   总被引:1,自引:0,他引:1  
基于片上多核处理器(Chip Multi-processor,CMP)的多种并行蚁群算法,包括并行最大最小蚂蚁系统、并行蚁群系统及两者的混合等5个并行算法,提出一种在CMP的每个处理器核心上模拟一个子蚁群,整体蚁群共享同一信息素矩阵,实现信息素隐式交流的方法.用多线程实时优先级实现该算法,并用若干旅行商问题实例进行了测试,分析了不同并行策略的影响.测试结果表明,基于CMP的并行蚁群具有相对于核心数目的线性加速比,异种蚁群混合策略在解的稳定性上更具优势。  相似文献   

4.
在多输入多输出-正交频分复用(multiple input multiple output-orthogonal frequency division multiplexing,MIMO-OFDM)系统上行多用户检测(multi-user detection,MUD)中,针对基本蚁群算法(ant colony optimization,ACO)在搜索过程中易出现过早停滞及收敛于局部最优解等问题,提出一种基于最大最小蚁群系统(max-min ant system,MMAS)的MUD新算法.该算法在蚁群每次循环结束后,仅处于最优路径上的单只蚂蚁释放信息素;同时,通过限制每条路径上信息素的取值范围,避免路径间信息素的差值过大,从而使蚂蚁在每次循环时尽可能地选择不同的路径,提高算法的搜索能力.仿真结果表明,MMAS算法能够有效降低蚁群陷入局部最优解的概率,进而提高了检测性能;同时,随用户数的增加,该算法的计算复杂度却远低于最大似然(maximum likelihood,ML)检测算法,因此,该算法能够在检测性能与计算复杂度之间取得较好的折中.  相似文献   

5.
2D packing问题是一种二维变量的打包问题,是典型的组合优化问题.本文首先通过贪婪方法得到一个初始解,然后利用经典的最大、最小蚂蚁算法作为解决问题的主要框架,并针对该问题将一种特定的局部搜索算法整合到主算法框架中.通过实验结果表明,该算法在解决此类问题上具有一定的优势.  相似文献   

6.
针对粒子滤波算法在重采样环节因粒子交互而不能充分并行处理的问题,提出了基于图形处理器(GPU)的并行骨干粒子群优化粒子滤波算法(BBPSO-PF).首先利用骨干粒子群算法具有易并行的特点优化粒子滤波算法重采样环节,从算法结构上提高粒子滤波算法的并行度.然后利用GPU的多线程架构并行处理每个粒子群的数据,每个线程负责一个粒子群,使粒子群之间得到并行化处理,解决粒子滤波重采样因粒子交互而不能充分并行的缺点.最后利用GPU中对齐与合并的内存访问原则,给粒子群设计高效的数据存储结构,降低内存访问事务,提高粒子群的数据存取速度,进一步提高算法实时性.该方法在保证算法精度前提下明显提高了算法的实时性.  相似文献   

7.
基于GPU的高光谱遥感岩矿信息快速提取方法   总被引:2,自引:0,他引:2  
提出了基于图形处理单元(graphics processing unit,GPU)的高光谱岩矿信息快速提取方法,利用GPU的并行计算优势对高光谱岩矿信息提取的核心步骤进行了并行优化设计。针对高光谱岩矿信息提取的算法特点,提出了相应的性能优化策略,包括优化算法流程、提高访存效率和减少数据访问冲突。实验结果表明,并行设计模型与优化方法能够快速有效地进行岩矿信息提取,并且最大加速比达到了81倍。  相似文献   

8.
拥塞避免是控制网络拥塞的一种有效的方法。本文提出了一种基于蚁群优化的动态自适应拥塞避免路由算法,引入最大最小蚁群模型(MMAS),在人工蚂蚁动态探索最优路径的同时,可以并存多条次优路径,算法引入了拥塞预警机制,对链路的拥塞程度进行监控,以避免陷入拥塞。仿真实验表明,该算法可以有效避免拥塞,提网络的传输速率和网络负载。  相似文献   

9.
蒙特卡洛模拟法常用来进行期权定价,但此算法存在运算量过大的问题.利用图形处理器(GPU)超强计算能力实现美式期权定价,在GPU上,首先优化实现了均匀随机数生成器,然后利用Box-Muller随机数转换算法产生随机数,最后优化实现了最小二乘蒙特卡洛模拟法的美式期权模拟定价系统.测试结果表明,GPU实现的最小二乘蒙特卡洛美式期权定价对比CPU的实现加速比最高达到了16.1.利用GPU的编程技术以更小的硬件代价,更高的执行效率,更好地完成由CPU完成的传统任务,较好地解决了蒙特卡洛模拟法运算量过大的问题,充分挖掘了GPU的通用计算潜力.  相似文献   

10.
并行多任务环境下Agent联盟的快速生成算法   总被引:1,自引:0,他引:1  
针对并行多任务环境下Agent联盟的生成问题,提出了基于多种群蚂蚁算法的Agent联盟生成策略.在该联盟生成策略中,种群内部蚂蚁相互合作,协调资源分配并完成相应任务;种群间蚂蚁进行资源竞争,协调解决并行多项任务间的资源冲突.同时,改进的信息素更新策略在综合考虑局部联盟收益和全局联盟收益的基础上提高了算法的全局搜索能力和生成联盟的质量.仿真实验结果表明,文中算法在多种典型条件下都能生成比现有算法更加高效的联盟结构.  相似文献   

11.
利用新的图形处理器架构重新评估利用可编程图形处理器加速标准粒子群优化算法的可行性和有效性. 针对新的图形处理器架构进行系统分析, 在此架构下实现了标准粒子群优化算法的并行版本. 实验结果表明, 通过合理运用新的图形处理器架构, 与其他标准粒子群优化算法的并行版本相比, 取得了良好的加速比.  相似文献   

12.
基于CUDA平台的时域有限差分算法研究   总被引:1,自引:1,他引:0  
文章针对传统时域有限差分(FDTD)算法的不足,以图形加速卡为核心,通过理论分析和数值模拟,研究并实现了基于CUDA平台的FDTD并行算法。CUDA是最新的可编程多线程的通用计算GPU模型,由于FDTD算法在空间上具有天然的并行性,因此非常适合在GPU上实现并行算。文章描述了在CUDA编程模型上的FDTD算法的设计以及优化过程,并通过数值仿真实验结果证明了基于GPU的并行FDTD算法可以大大减少计算时间,基于GPU加速已成为电磁场数值计算的研究热点之一。  相似文献   

13.
介绍了一种基于GPU(Graphic Processing Unit)并行处理的地形三维快速重建算法。该算法利用分而治之的思想,基于CUDA编程框架,首先计算每一点的邻域信息,并在其切平面上进行局部的三角剖分,然后合并形成最终的地形网格。实验结果表明,基于GPU并行化处理的三维重建算法高效、稳定,可以快速的实现结构复杂的大规模地形的三维重建。  相似文献   

14.
随着图像数据量的增加,传统单核处理器或多处理器结构的计算方式已无法满足图像灰度化实时处理需求.该文利用图像处理器(GPU)在异构并行计算的优势,提出了基于开放式计算语言(OpenCL)的图像灰度化并行算法.通过分析加权平均图像灰度化数据处理的并行性,对任务进行了层次化分解,设计了2级并行的并行算法并映射到“CPU+GPU”异构计算平台上.实验结果显示:图像灰度化并行算法在OpenCL架构下NVIDIA GPU计算平台上相比串行算法、多核CPU并行算法和CUDA并行算法的性能分别获得了27.04倍、4.96倍和1.21倍的加速比.该文提出的并行优化方法的有效性和性能可移植性得到了验证.  相似文献   

15.
在高分辨率图像日益普及的情况下,Roberts边缘检测的处理速度急需进一步提高。在CPU表现不尽如人意的情况下,基于CPU/GPU和CPU/MIC的高度并行运算的研究愈加深入。在分析Roberts算法特点的基础上,将能并行的部分移植到GPU和MIC上进行。完成基于CPU/GPU和CPU/MIC的异构架构上的Roberts算法实现,并针对CPU/MIC上将程序进行向量化优化。实验结果表明,在相同单精度浮点运算能力下,GPU处理低分辨率图像的速度更快、加速比更高,但处理高分辨率图像时MIC的加速比最高为23.52,高于GPU的21.43。  相似文献   

16.
一种小功率开关稳压电源设计   总被引:2,自引:0,他引:2  
本文设计了一种以电流型PWM控制器5L0380为控制核心的单端反激式开关稳压电源。重点给出EMI滤波器、整流电路、变压器、控制电路、反馈电路的参数设计。实验结果表明,所制作的电源具有稳压性能优良、纹波小、电压调整率和负载调整率小等优点。  相似文献   

17.
开发了基于图形处理器(GPU)的Cholesky分解并行算法,应用于模态计算程序中,对计算进行加速.算例测试表明该算法相对串行算法计算性能大幅提升,且加速比随矩阵阶数增加而增加,与串行程序相比加速比可达到19.6,此时GPU浮点运算能力达到298Gflops.GPU程序固有频率计算结果与Abaqus计算结果的误差在2%以内,具有足够的计算精度.  相似文献   

18.
针对传统CPU平台下小波变换算法难满足当前高分辨率、 大数据规模下的实时性要求, 提出一种基于GPU的并行小波变换算法, 并通过改善Local Memory访存数据的局部性和增加Global Memory访存带宽的优化技术, 利用多Kernel并行提高多种分辨率下小波变换的性能. 实验结果表明, 与CPU串并行版本相比, GPU并行优化算
法在高分辨率变换情况下, 加速比最高可达30~60倍, 可满足对变换实时性的要求.  相似文献   

19.
高维空间的近邻检索是多媒体信息领域的重要研究课题.文章提出一种基于CUDA的高维空间距离检索排序算法,通过并行优化空间距离计算及排序过程,充分利用GPU硬件特性和它的并行运算能力,能极大地提高高维空间的检索速度,并可获取精确的距离排序数据.实验结果表明,该文算法可达到百万级别高维数据的实时检索,极大地拓展了高维检索的应...  相似文献   

20.
针对人工神经网络训练需要极强的计算能力和高效的最优解搜寻方法的问题,提出基于GPU的BFGS拟牛顿神经网络训练算法的并行实现。该并行实现将BFGS算法划分为不同的功能模块,针对不同模块特点采用混合的数据并行模式,充分利用GPU的处理和存储资源,取得较好的加速效果。试验结果显示:在复杂的神经网络结构下,基于GPU的并行神经网络的训练速度相比于基于CPU的实现方法最高提升了80倍;在微波器件的建模测试中,基于GPU的并行神经网络的速度相比于Neuro Modeler软件提升了430倍,训练误差在1%左右。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号