首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
为降低粒子群优化算法(PSO: Particle Swarm Optimization)时间和空间的复杂度随问题规模的增大而越来越高的问题, 对图形处理器(GPU: Graphic Processing Unit)用于并行计算的方法进行了分析, 利用GPU的并行特性, 实现了粒子群优化算法路径搜索过程的并行化。测试函数实验结果证明, GPU平台较CPU模式下的计算, 其搜索速率有明显提高。  相似文献   

2.
针对SAR实时成像系统的传统计算平台实时性不足与功耗过高的问题,研究了一种基于嵌入式GPU的实现方法.为了充分利用嵌入式GPU中有限的内存资源,提出一种内存分割与重配置方案,采用页锁定内存和zero-copy技术,实现数传-计算并行化处理;为解决实时性问题,在算法并行计算环节,利用共享内存、寄存器等资源实现大规模数据并行.结果表明,在TX2上完成16 384×8 192点滑聚SAR成像处理时间为12.66 s,功耗为15 W.该优化方法也适用于其他模式的雷达处理算法,并可为未来嵌入式实时成像处理提供参考.   相似文献   

3.
针对信息处理中常见的字符串匹配问题,通过对经典的Brute Force算法和KnuthMorris-Pratt算法进行分析,根据GPU异构并行计算任务的分配特性,设计一种针对Knuth-Morris-Pratt算法的数据重叠划分并行方案,并提出一种基于移动平台的异构并行字符串匹配算法KMP_MOP.在PowerVR移动平台环境下使用千万级长度的字符串数据对算法的性能进行测试,同时对算法在其他平台的执行情况进行比较,验证了并行算法的性能可移植性.实验结果表明,KMP_MOP算法能充分利用移动平台中的GPU性能,有效提高具有GPU的移动平台设备的字符串匹配效率.  相似文献   

4.
针对压缩感知系统实时应用的需要,探讨了A*OMP算法的并行设计及基于GPU的加速方法.将耗时长的矩阵逆运算转化为可并行的矩阵/向量操作,并结合算法本身的关联特性,进一步采用迭代法实现以降低其计算复杂度.利用GPU高效的并行运算能力,将算法中可并行的矩阵/向量计算映射到GPU上并行执行,在面向Matlab的Jacket软件平台上对整体串行算法进行了并行化的设计与实现.在NVIDIA Tesla K20Xm GPU和Intel(R)E5-2650 CPU上进行了测试,实验结果表明:对比CPU平台的串行实现,基于GPU的A*OMP算法整体上可获得约40倍的加速,实现了在保持系统较高重构质量的同时能有效降低计算时间,较好地满足了系统实时性的需要.  相似文献   

5.
针对基于DMAS波束合成的平面波超声成像算法的图像对比信噪比偏低及算法复杂度大,无法实现实时成像的问题,提出了一种具有较高成像质量和较小计算复杂度的平面波超声成像算法DSBMGCF(delay sum before multiply and generalized coherence factor),借助FieldII仿真工具在Matlab上进行点目标和囊肿目标的仿真实验,验证了该算法的成像质量.同时,对所提出的新算法进行了并行化研究和改进,得到了一种适合在GPU上并行实现的平面波超声成像并行算法PDMASGCF(parallel delay multiply and sum generalized coherence factor),并在实验室戴尔T7810普通工作站上进行了平面波超声成像时间和质量的验证实验,获得了较高的成像帧频,并保证了较好的成像性能.  相似文献   

6.
分析了K-means算法在GPU上实现并行计算的可能性,并在GTX8800 GT显卡上实现,研究了GPU的存储访问机制,在对数据进行合理组织基础上对算法进行改进,避免了存储体冲突的产生,提高了算法的健壮性.研究结果证明该方法在GPU上的并行运算速度明显快于CPU,加速比高.  相似文献   

7.
并行计算是遥感图像快速处理的基本方法,而并行算法则是实现这种方法的关键之一.针对星载SAR图像几何校正中单幅图像的快速处理问题,首先分析了一种串行校正算法的可并行特征,随后分别设计了一种面向多CPU/核和一种面向GPU的全局并行校正算法,并利用2幅星载SAR图像测试了多种数据粒度下这2种算法的加速效能.实验结果表明,这2种并行算法可以大幅提高星载SAR图像的几何校正速度;CPU并行算法的性能主要与CPU/核心数目有关,而GPU并行算法则主要与数据粒度有关;后者具有很高的加速比,是几何校正的高效方法.  相似文献   

8.
针对近年来利用CUDA技术在个人计算机显卡的GPU上实现LBM并行加速计算的研究越来越多,但对在GPU中使用不同GPU存储器进行计算的具体实现算法以及其对计算性能的影响分析研究甚少,文章实现了在GPU中使用不同存储器进行IBM并行计算,给出了具体的实现算法,并以平面Poiseuille流为算例,在普通个人计算机上,分别使用NVIDIA GeForce GTS 450 GPU和Intel Core i5-760 4核CPU进行计算.结果表明,两者计算结果吻合得很好,最高获得了约107倍的加速比,验证了在GPU上进行LBM并行计算的可行性以及加速性能,为在低成本的个人计算机上高效率地解决计算流体力学中的复杂计算问题提供了一种非常有效的途径.  相似文献   

9.
金建刚  刘具群 《科技资讯》2006,13(35):254-255
大整数相乘问题是计算机算法设计与分析中的一个经典问题,分治法是一个有效的解决算法复杂度的方法,而神经网络的分布式存储、并行计算等特点可以大大减少计算时间.因此将分治法与神经网络结合是一种可行的方法,仿真实验也验证了这种方法的可行性和有效性.  相似文献   

10.
基于CUDA的H.264/AVC视频编码的设计与实现   总被引:1,自引:0,他引:1  
为了提高编码速率,将视频编码中计算量较大的运动估计和离散余弦变换(DCT)系数计算移植到图像处理器(GPU)上处理.根据H.264/AVC的编码要求和处理器的并行结构,提出了一种并行处理方法,并利用统一计算设备架构(CUDA)的计算平台,实现了H.264/AVC中的运动估计和DCT变换系数的计算.实验表明:在GPU上采用并行计算方法可较大程度地提高视频编码速度.  相似文献   

11.
针对二维水动力模型应用于城市内涝模拟时,在大尺度区域或精细分辨率情形下运行耗时过长的问题,通过耦合SWMM模型和LISFLOOD-FP模型构建城市内涝模型,采用GPU的并行计算技术加速城市二维内涝模型。以盐城响水县城区的内涝模拟为例,对并行模型的效率进行分析,结果表明,基于GPU的并行计算技术可以显著提升模型运行效率,在5 m分辨率下能够8 min内模拟12 h的内涝事件,可用于突发内涝事件下的快速响应;并行模型的加速效果在更高的空间分辨率下表现更明显,在2 m分辨率下取得最高10.86倍的加速比;要最大化发挥GPU计算效率,首先需要单步长有较大的计算量,其次是要尽量减少与GPU的数据频繁传输导致的额外开销。  相似文献   

12.
克里金法是一种应用广泛的低通滤波性插值方法,但其无法重建原始信息中的高频、低频和局部信息。分形插值算法可利用自相似性,在保留原始信息的基础上,克服克里金插值中低通滤波的局限性,从而提高插值的准确性。本文在传统分形插值算法的基础上,结合地质空间信息,提出了适用于矿床品位估算的四维空间分形插值算法,并将其应用于钼矿的品位估算。结果表明:在该钼矿的品位估算中,四维空间分形插值算法明显优于克里金法。  相似文献   

13.
由于矿床形成过程复杂、控制因素多,导致估计矿石品位相对困难.尽量降低矿床预测中的估计误差对矿产资源的开发和利用是至关重要的.克立格法被认为是最佳的品位估计方法,其必须满足对于品位空间分布的平稳性和内蕴假设.但实践上,大部分的品位数据具有稀疏、不规则而复杂的空间分布,这有时会导致克立格法违反平稳性和内蕴假设.本文提出基于多基因遗传规划的矿石品位估计方法,并将其与克立格法进行对比.结果显示,基于多基因遗传规划的方法不需要关于空间分布的假设.这样,简化了实施矿体品位预测的条件,并能取得较好的预测结果,可应用于复杂矿体品位的预测.  相似文献   

14.
正交频分复用(OFDM)是一种高效的数据传输技术,具有良好的抗衰落能力,可实现并行传输.但是OFDM对同步误差十分敏感,特别是频率同步误差.传统的基于导频和循环前缀的算法虽对频偏估计很有效,但计算复杂度较高.该文在联合算法的基础上提出了一种改进的频率同步算法.该算法通过简化最大似然函数降低了频偏估计的计算复杂度并提高了估计性能.通过仿真表明,在信噪比较高时,改进的算法频偏估计性能更优于联合算法.  相似文献   

15.
基于GPU的数字信号处理中相关性计算的研究   总被引:1,自引:0,他引:1  
现代信号处理和通信系统对信号的处理,正变得越来越复杂并且计算也越来越密集,如何提高这些领域中信号处理的运算速度和运算精度已经成为当今一个重要的研究方向,GPU由于其特殊的结构,使其非常适合用于加速数据运算仿真和图形图像分析.本文提出一种基于GPU的信号相关性并行计算的方法,通过实验验证得出基于GPU的数字信号相关性的并行处理方法明显优于基于CPU下的处理方法,实验结果最高加速比达到了14.5倍,现代GPU技术的发展给通信信号处理领域带来新的途径.  相似文献   

16.
空间变异函数的数学模型及参数反演   总被引:1,自引:0,他引:1  
空间变异函数在克里格估计中占有重要地位.基于椭圆分布函数可导出两类空间变异函数的数学模型.一类是只考虑变程各项异性的模型,称之为AE模型;一类是只考虑拱高各项异性的模型,称之为CE模型.传统的方法需要先进行空间变异函数的拟合,然后进行克里格估计.交叉检验方差是评价估计精度的一项重要指标.根据克里格方程组的重要性质,克里格估值仅与标准变异函数有关,对标准变异函数进行线性变换得到新的变异函数不会改变克里格估值和交叉检验方差.因此,用拟合方法获得的最优变异函数进行交叉检验,通常并不能有效地降低交叉检验方差.如果直接以交叉检验方差为目标函数进行参数反演,则可以有效地解决这个问题.变异函数数学模型一般含有5个参数,其中2个是线性变换作用.进行交叉检验时只需研究标准变异函数的3个参数,从而可以降低参数反演的复杂度.研究表明:较之AE类模型CE类模型具有更强的适应性,通常可获得更小的交叉检验方差;鉴于评价面非常复杂,将遗传算法(GA)应用于参数反演是可行和有效的.滦河流域降水量空间插值实例表明,交叉检验均方差降幅分别为11.7%和29.8%.  相似文献   

17.
传统算法数据划分冗余度和倾斜度高,无用连接数据多,降低负载均衡性,对整体效率产生不好的影响,不适于实际应用。为此,面向混合动态数据库集群提出一种新的并行空间连接优化算法。采用网格划分法对数据进行划分,依据空间数据划分结果获取数据分布状态,计算节点按照数据分布状态得到候选集。通过平面扫描形成若干子空间连接的子任务,利用构建节点花费模型,依据花费模型对并行空间连接所需的平均节点访问个数进行评估,把候选任务集分配至不同计算节点,在不同节点执行并行空间连接操作。通过边界过滤策略,删除不可能有结果的元组,提高效率,增强算法的实用性。实验结果表明,所提算法适于实际应用,效率高。  相似文献   

18.
并行计算是提高音频大地电磁(audio-frequency magnetotelluric method,AMT)数据反演效率的有效途径。本文在统一计算设备架构(compute unified device architecture,CUDA) 下开展带地形的AMT数据二维反演并行算法研究,旨在利用GPU强大的计算能力及并行计算技术实现高精度、快速度的AMT数据二维反演。首先利用有限元和自适应正则化反演算法实现AMT数据二维反演的串行化计算;然后在PGI Visual Fortran+ CUDA5.5环境下编写基于CPU+GPU的CUDA并行代码,将正演中的频率循环、反演中的模型灵敏度矩阵计算和反演方程正则化求解部分进行并行化处理;通过不同复杂程度的理论模型正反演模拟验证了该并行算法的有效性和准确性。不同模型和不同模式下的数值模拟结果对比表明,基于CPU+GPU的CUDA并行算法相较于传统的CPU串行算法,在灵敏度矩阵计算和反演方程正则化方面耗时更少,加速比最高可达10倍以上。最后将该并行算法应用于某矿区实测AMT数据的二维反演中,取得了较好的应用效果。  相似文献   

19.
针对标准Hough变换存储空间需求高、计算量大的缺陷,提出了一种用分布式并行计算实现Hough变换的方法,对分布式算法的分析与设计、Java远程方法调用、多线程同步、负载均衡等关键问题进行了讨论.实验表明,在拥有k台提供资源计算机的分布式系统中,分布式并行计算的时空开销可降低到标准Hough变换的大约1/k.  相似文献   

20.
为了在复杂环境以及低信噪比情况下实现符号速率的准确估计,降低算法的复杂度和运算量,提出一种针对MPSK/MQAM(multiple phase shift keying/multiple quadrature amplitude modulation )类信号符号速率估计的新方法,通过对A/D采样后的信号进行数字下变频处理得到零中频信号,利用I路和Q路信号构造一个复数函数,生成含有与符号速率相关的离散谱线,通过检测离散谱线的位置实现符号速率的估计。通过MATLAB仿真实验以及在FPGA(field programmable gate array)与DSP(digital signal processor)硬件平台上利用实际信号对算法的性能就行了测试,验证了该方法的有效性。结果表明,该算法复杂度低,运算量小,适应性好,在低信噪比情况下仍具有较高估计精度。同时,该方法所得到的数据也可以用来进行信号识别和其他参数的测量,这在工程实践中具有很高的应用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号