首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 54 毫秒
1.
图像噪声降低了图像信噪比和质量,去噪是图像处理工作的重要环节之一.本文提出了一种基于开放式计算语言(OpenCL)架构的图像中值滤波快速降噪并行算法.介绍了OpenCL体系结构特点和中值滤波处理流程.根据图形处理器(GPU)的并发结构特点,对图像中值滤波功能模块进行了并行优化,降低了算法复杂度.通过充分激活NDRange索引空间中的工作组和工作项来提高数据访问效率,优化内核工作组配置参数,实现了中值滤波器的并行处理.实验结果表明,在图像质量保持不变的情况下,与基于CPU的串行算法、基于开放多处理(OpenMP)并行算法和基于统一计算设备架构(CUDA)并行算法性能相比,图像中值滤波并行算法在OpenCL架构下NVIDIA GPU计算平台上分别获得了29.74、17.29、1.15倍的加速比.验证了算法的有效性和平台的可移植性,基本满足应用的实时性处理要求.  相似文献   

2.
针对最短路径算法处理大规模数据集低效的问题,提出了基于图形处理器(Graphics Processing Unit,GPU)加速的全源对最短路径并行算法.首先通过优化矩阵乘法算法实现了在工作组内和组间进行并行运算数据,然后减少了非规则行造成的工作项分支,最后降低了工作项对邻接矩阵计算条带存储资源的访问延时.实验结果表明,与基于AMD Ryzen5 1600X CPU的串行算法、基于开放多处理(Open Multi-Processing, OpenMP)并行算法和基于统一计算设备架构(Compute Unified Device Architecture, CUDA)并行算法相比,最短路径并行算法在开放式计算语言(Open Computing Language, OpenCL)架构下NVIDIA GeForce GTX 1 070计算平台上分别获得了196.35、36.76和2.25倍的加速比,验证了提出的并行优化方法的有效性和性能可移植性.  相似文献   

3.
针对数值计算中前缀和运算数据量大、耗时巨大这一难题,提出了一种基于开放式计算语言(Open Computing Language,OpenCL)的分段式前缀和并行算法。首先进行了分段式前缀和算法的并行性分析,对任务进行了层次化分解与组合,设计了两级并行的分段式前缀和算法;然后通过OpenCL编程将前缀和并行算法映射到CPU+GPU系统平台上,实现了层次化并行前缀和处理;最后,根据计算单元(Compute Unit,CU)的资源条件,增加CU中本地存储器的分配,通过改进工作节点的访问模式来降低bank冲突,提高访存速度。实验结果表明,与基于AMD Opteron 2439 SE CPU的串行算法、基于OpenMP(Open Multi-Processing)并行算法和基于统一计算设备架构并行算法性能相比,前缀和并行算法在OpenCL架构下NVIDIA Tesla C2075计算平台上分别获得了33.51倍、6.26倍和2.41倍的加速比。验证了提出的并行优化方法的有效性和性能可移植性。  相似文献   

4.
针对当前算法优化研究一般局限于单一硬件平台、很难实现在不同平台上高效运行的问题,利用图形处理器(GPU)提出了基于开放式计算语言(OpenCL)的矩阵转置并行算法.通过矩阵子块粗粒度并行、矩阵元素细粒度并行、工作项与数据的空间映射和本地存储器优化方法的应用,使矩阵转置算法在GPU计算平台上的性能提高了12倍.实验结果表明,与基于CPU的串行算法、基于开放多处理(OpenMP)并行算法和基于统一计算设备架构(CUDA)并行算法性能相比,矩阵转置并行算法在OpenCL架构下NVIDIA GPU计算平台上分别获得了12.26,2.23和1.50的加速比.该算法不仅性能高,而且实现了在不同计算平台间的性能移植.  相似文献   

5.
介绍OpenCL基本原理及其特点,分析其在生物医学图像处理中的应用,并以图像清晰度计算算法四邻域法为例进行算法并行化。计算结果表明,在PC平台进行图像清晰度计算时,基于GPU计算的OpenCL技术可以极大地提高图像处理的速度,使得普通计算机上也可实现复杂的生物医学图像处理及可视化应用。  相似文献   

6.
基于灰度图像的曝光量估计方法   总被引:1,自引:0,他引:1  
赵芳  栾晓明  孙越 《应用科技》2009,36(8):32-34
针对宽范围光照场景下成像系统存在的曝光不足或曝光过度的问题,以灰度图像的灰度直方图为基础,计算平均灰度,依据峰值灰度和灰度图像两侧是否存在零像素区域,估计图像曝光量效果是否恰当.研究了图像灰度直方图的灰度分布与曝光效果的关系,应用估计方法给出了曝光系列图像的实验结果.实验结果表明,此算法能够计算估计出图像的曝光效果,无需数据库支撑,复杂度低,易于实现.  相似文献   

7.
基于灰度最优阈值的图像分割方法及应用   总被引:2,自引:0,他引:2  
讨论了在对图像进行分割时的一维、二维灰度直方图分割方法,对最优阈值灰度分割方法原理进行了描述,得出了最优阈值灰度分割算法。实验结果表明:利用此算法对图像进行分割能够得到较好的分割效果。  相似文献   

8.
大熊猫作为中国国宝,其监测及保护更受到越来越多的关注。本文详细介绍基于灰度空间的阈值分割方法,用于大熊猫图片前景的提取,并与基于YCbCr颜色空间的分割算法进行对比,分析阈值分割的适用范围及分割效果。  相似文献   

9.
许俊峰 《科技资讯》2012,(28):16-17
灰度图像是图像样本中最基础的一种,具有数据量小,表示简单,编码、存储、传输方便等优势,同时也是构建复杂彩色图像的基石,对于大多数图像处理场合都适用。本文通过研究低质量,高噪声灰度图像的像素特征,提出对静态灰度图像进行校正的综合点运算,包含分布运算,线性变换、阀值设定、窗口变换及灰度拉伸等各种子算法。实践证明,对不同图像进行合适的各种具体点运算对于灰度图像有很好的校正效果,极大提升了灰度图的质量,在此基础上后期加入色度算子还可以提升静态彩色图像的质量。  相似文献   

10.
一种基于分块与直方图相结合的灰度图像检索算法   总被引:2,自引:0,他引:2  
丁志勇 《甘肃科技》2006,22(1):59-60
利用色彩直方图计算简单并具有平移、旋转不变性等优点,通过给图像分块,从而比较好的解决了全局颜色的空间分布信息丢失问题。实验证明,该算法不失为一种较为有效的图像检索算法。  相似文献   

11.
图形处理单元(GPU)已经成为当今的主流计算系统的一个组成部分,现代GPU不仅是一个功能强大的图形引擎,也是一个高度并行的可编程处理器,GPU的峰值运算和内存带宽往往大幅超出其CPU所对应的峰值和内存带宽.本文介绍了基于GPU通用计算框架的JACKET加速MATLAB的计算仿真方法,通过FFT算法得出仿真结果,分析在CPU和GPU运行环境下的GFLOPS和加速比,最后得出基于GPU的MATLAB计算仿真程序运行效率在JACKET的加速下大大提高了.  相似文献   

12.
针对人工神经网络训练需要极强的计算能力和高效的最优解搜寻方法的问题,提出基于GPU的BFGS拟牛顿神经网络训练算法的并行实现。该并行实现将BFGS算法划分为不同的功能模块,针对不同模块特点采用混合的数据并行模式,充分利用GPU的处理和存储资源,取得较好的加速效果。试验结果显示:在复杂的神经网络结构下,基于GPU的并行神经网络的训练速度相比于基于CPU的实现方法最高提升了80倍;在微波器件的建模测试中,基于GPU的并行神经网络的速度相比于Neuro Modeler软件提升了430倍,训练误差在1%左右。  相似文献   

13.
针对待拼接的无人机遥感图像重叠区域不规则、焦距不固定、含噪声较多等问题, 在加权平均融合算法的基础上引入基于折线化思想的不规则重叠区域生成法, 减小算法误差, 并运用基于距离比的自适应算法实现权值自动匹配, 使算法在不受重叠区域形状限制的同时得到更精确的计算结果, 解决了图像拼接后融合区域分辨率低、拼接线明显的问题。仿真表明, 改进的加权平均融合算法在保持原算法快速性的同时, 达到了去除拼接缝隙、使图像融合区域过渡平滑的目的, 并获得了融合质量较好的大视野无缝拼接图像。  相似文献   

14.
针对算法运行时间随问题规模增大而迅速增加这一特性,探讨了一种基于WIN32环境搭建PVM并行虚拟机的具体方法,设计了一种基于数据分割的二维并行DCT算法,并把该算法应用于基于JPEG的图像压缩实际,同时设计了相应的实验方案.通过在串行和并行环境下进行对比实验,结果表明:在运算量随着问题规模增加的时候,并行方案能有效地改善算法运行性能.  相似文献   

15.
16.
提出一种基于Relief-F特征加权支持向量机的语义图像分类方法。首先,通过Relief-F算法计算训练数据集中图像的特征权重;然后,利用具有不同权重的特征向量来计算核函数并且训练支持向量机;最后,用经过训练的支持向量机对测试数据集中的图像进行自动分类。实验结果表明,基于Relief-F特征加权支持向量机的语义图像分类方法在分类准确率和训练时间耗费上均优于传统的支持向量机方法。  相似文献   

17.
为降低粒子群优化算法(PSO: Particle Swarm Optimization)时间和空间的复杂度随问题规模的增大而越来越高的问题, 对图形处理器(GPU: Graphic Processing Unit)用于并行计算的方法进行了分析, 利用GPU的并行特性, 实现了粒子群优化算法路径搜索过程的并行化。测试函数实验结果证明, GPU平台较CPU模式下的计算, 其搜索速率有明显提高。  相似文献   

18.
网格计算平台GBuilder的设计研究   总被引:2,自引:0,他引:2  
针对GT3对网格开发存在的不足,提出了基于开放源码的开发工具Ec lipse平台,通过相应的面向对象方法学知识,以插件形式来封装对OGSA标准的事务调度,构建网格计算平台GBu ilder,使用户开发网格服务实现可视化操作。主要工作包括基于GT3开发网格服务流程的设计、网格计算平台GBu ilder的体系结构设计和功能描述、以及设计该平台的支撑软件Ec lipse和EMF插件的介绍。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号