共查询到19条相似文献,搜索用时 90 毫秒
1.
图像噪声降低了图像信噪比和质量,去噪是图像处理工作的重要环节之一.本文提出了一种基于开放式计算语言(OpenCL)架构的图像中值滤波快速降噪并行算法.介绍了OpenCL体系结构特点和中值滤波处理流程.根据图形处理器(GPU)的并发结构特点,对图像中值滤波功能模块进行了并行优化,降低了算法复杂度.通过充分激活NDRange索引空间中的工作组和工作项来提高数据访问效率,优化内核工作组配置参数,实现了中值滤波器的并行处理.实验结果表明,在图像质量保持不变的情况下,与基于CPU的串行算法、基于开放多处理(OpenMP)并行算法和基于统一计算设备架构(CUDA)并行算法性能相比,图像中值滤波并行算法在OpenCL架构下NVIDIA GPU计算平台上分别获得了29.74、17.29、1.15倍的加速比.验证了算法的有效性和平台的可移植性,基本满足应用的实时性处理要求. 相似文献
2.
针对最短路径算法处理大规模数据集低效的问题,提出了基于图形处理器(Graphics Processing Unit,GPU)加速的全源对最短路径并行算法.首先通过优化矩阵乘法算法实现了在工作组内和组间进行并行运算数据,然后减少了非规则行造成的工作项分支,最后降低了工作项对邻接矩阵计算条带存储资源的访问延时.实验结果表明,与基于AMD Ryzen5 1600X CPU的串行算法、基于开放多处理(Open Multi-Processing, OpenMP)并行算法和基于统一计算设备架构(Compute Unified Device Architecture, CUDA)并行算法相比,最短路径并行算法在开放式计算语言(Open Computing Language, OpenCL)架构下NVIDIA GeForce GTX 1 070计算平台上分别获得了196.35、36.76和2.25倍的加速比,验证了提出的并行优化方法的有效性和性能可移植性. 相似文献
3.
针对数值计算中前缀和运算数据量大、耗时巨大这一难题,提出了一种基于开放式计算语言(Open Computing Language,OpenCL)的分段式前缀和并行算法。首先进行了分段式前缀和算法的并行性分析,对任务进行了层次化分解与组合,设计了两级并行的分段式前缀和算法;然后通过OpenCL编程将前缀和并行算法映射到CPU+GPU系统平台上,实现了层次化并行前缀和处理;最后,根据计算单元(Compute Unit,CU)的资源条件,增加CU中本地存储器的分配,通过改进工作节点的访问模式来降低bank冲突,提高访存速度。实验结果表明,与基于AMD Opteron 2439 SE CPU的串行算法、基于OpenMP(Open Multi-Processing)并行算法和基于统一计算设备架构并行算法性能相比,前缀和并行算法在OpenCL架构下NVIDIA Tesla C2075计算平台上分别获得了33.51倍、6.26倍和2.41倍的加速比。验证了提出的并行优化方法的有效性和性能可移植性。 相似文献
4.
针对当前算法优化研究一般局限于单一硬件平台、很难实现在不同平台上高效运行的问题,利用图形处理器(GPU)提出了基于开放式计算语言(OpenCL)的矩阵转置并行算法.通过矩阵子块粗粒度并行、矩阵元素细粒度并行、工作项与数据的空间映射和本地存储器优化方法的应用,使矩阵转置算法在GPU计算平台上的性能提高了12倍.实验结果表明,与基于CPU的串行算法、基于开放多处理(OpenMP)并行算法和基于统一计算设备架构(CUDA)并行算法性能相比,矩阵转置并行算法在OpenCL架构下NVIDIA GPU计算平台上分别获得了12.26,2.23和1.50的加速比.该算法不仅性能高,而且实现了在不同计算平台间的性能移植. 相似文献
5.
6.
7.
基于灰度最优阈值的图像分割方法及应用 总被引:2,自引:0,他引:2
讨论了在对图像进行分割时的一维、二维灰度直方图分割方法,对最优阈值灰度分割方法原理进行了描述,得出了最优阈值灰度分割算法。实验结果表明:利用此算法对图像进行分割能够得到较好的分割效果。 相似文献
8.
大熊猫作为中国国宝,其监测及保护更受到越来越多的关注。本文详细介绍基于灰度空间的阈值分割方法,用于大熊猫图片前景的提取,并与基于YCbCr颜色空间的分割算法进行对比,分析阈值分割的适用范围及分割效果。 相似文献
9.
灰度图像是图像样本中最基础的一种,具有数据量小,表示简单,编码、存储、传输方便等优势,同时也是构建复杂彩色图像的基石,对于大多数图像处理场合都适用。本文通过研究低质量,高噪声灰度图像的像素特征,提出对静态灰度图像进行校正的综合点运算,包含分布运算,线性变换、阀值设定、窗口变换及灰度拉伸等各种子算法。实践证明,对不同图像进行合适的各种具体点运算对于灰度图像有很好的校正效果,极大提升了灰度图的质量,在此基础上后期加入色度算子还可以提升静态彩色图像的质量。 相似文献
10.
一种基于分块与直方图相结合的灰度图像检索算法 总被引:2,自引:0,他引:2
利用色彩直方图计算简单并具有平移、旋转不变性等优点,通过给图像分块,从而比较好的解决了全局颜色的空间分布信息丢失问题。实验证明,该算法不失为一种较为有效的图像检索算法。 相似文献
11.
12.
相对于先前的并行人工蜂群算法进行了一些改进,主要采用OpenCL本地内存、并行规约等技术,提出了一种基于图形处理器(GPU)改进的并行人工蜂群算法.该算法将采蜜蜂映射为OpenCL一个工作项,跟随蜂采用右邻域优先的局部选择机制.实验结果表明:文中提出的改进并行人工蜂群算法提高了算法的执行效率,收敛速度得到提升. 相似文献
13.
针对摄像设备拍摄视频抖动问题和实时处理要求,本文提出一种改进的基于角点检测的并行化电子稳像算法.该算法采用并行计算和软硬件协同计算的方法,对基于Harris角点检测及Hu几何不变矩的电子稳像算法进行了改进,算法通过网格划分和区域极限值的并行计算,减少了角点检测的计算量,采用并行化改进的RANSAC计算提升了剔除误匹配的处理效率,并基于图形处理器(Graphic Processing Unit,GPU)和FPGA完成了电子稳像算法的优化设计实现.实验结果表明,本文算法在保证良好稳像质量的同时,对720p视频进行单帧稳像的时间仅为25.48ms,能够完成帧率为30帧/s的分辨率为1 280×720的视频实时稳像. 相似文献
14.
从图像中快速检测直线的并行算法 总被引:3,自引:0,他引:3
提出了一种在具有可扩展机群体系结构的通用超级并行机环境下的快速直线检测算法.采用最优域划分法将原图像进行NXN等面积划分,并映射到并行系统各节点的局部坐标下进行直线检测.通过先后两次在Hough变换的扫描过程中提前引入闽值作用,可有效减小计算的复杂度.同时证明了,划分后的子图像采用原阈值的1/(2N-1)进行检测,可满足原图像中的直线目标不丢失的要求.实验结果表明,所提算法具备高鲁棒性和强抗噪能力,能有效提升加速比,该比值的最大值可为25.320. 相似文献
15.
针对待拼接的无人机遥感图像重叠区域不规则、焦距不固定、含噪声较多等问题, 在加权平均融合算法的基础上引入基于折线化思想的不规则重叠区域生成法, 减小算法误差, 并运用基于距离比的自适应算法实现权值自动匹配, 使算法在不受重叠区域形状限制的同时得到更精确的计算结果, 解决了图像拼接后融合区域分辨率低、拼接线明显的问题。仿真表明, 改进的加权平均融合算法在保持原算法快速性的同时, 达到了去除拼接缝隙、使图像融合区域过渡平滑的目的, 并获得了融合质量较好的大视野无缝拼接图像。 相似文献
16.
Weiyan Wang Yunquan Zhang Shengen Yan Ying Zhang Haipeng Jia . Laboratory of Parallel Software Computational Science 《清华大学学报》2012,(3):287-295
Face detect application has a real time need in nature. Although Viola-Jones algorithm can handle it elegantly, today’s bigger and bigger high quality images and videos still bring in the new challenge of real time needs. It is a good idea to parallel the Viola-Jones algorithm with OpenCL to achieve high performance across both AMD and NVidia GPU platforms without bringing up new algorithms. This paper presents the bottleneck of this application and discusses how to optimize the face detection step by step from a very nave implementation. Some brilliant tricks and methods like CPU execution time hidden, stubbles usage of local memory as high speed scratchpad and manual cache, and variable granularity were used to improve the performance. Those technologies result in 4-13 times speedup varying with the image size. Furthermore, those ideas may throw on some light on the way to parallel applications efficiently with OpenCL. Taking face detection as an example, this paper also summarizes some universal advice on how to optimize OpenCL program, trying to help other applications do better on GPU. 相似文献
17.
针对人工神经网络训练需要极强的计算能力和高效的最优解搜寻方法的问题,提出基于GPU的BFGS拟牛顿神经网络训练算法的并行实现。该并行实现将BFGS算法划分为不同的功能模块,针对不同模块特点采用混合的数据并行模式,充分利用GPU的处理和存储资源,取得较好的加速效果。试验结果显示:在复杂的神经网络结构下,基于GPU的并行神经网络的训练速度相比于基于CPU的实现方法最高提升了80倍;在微波器件的建模测试中,基于GPU的并行神经网络的速度相比于Neuro Modeler软件提升了430倍,训练误差在1%左右。 相似文献
18.
分析了Matlab并行计算工具箱中各部件的关系,对分布式并行计算环境中的关键参数进行了设置,构建了并行计算机群。将基于Matlab机群的分布式并行处理引入到图像匹配中。以灰度相关匹配算法为例,结合并行处理对图像灰度匹配进行并行实现。实验结果表明:并行化处理能有效缩短匹配时间,对进一步研究并行图像处理有一定的指导意义。 相似文献
19.
基于并行量子遗传算法的QoS组播路由方法 总被引:4,自引:0,他引:4
通信网络时延受限且满足带宽要求的最小代价组播树问题是NP完全问题,传统方法难以求解,一般采用启发式方法求解.提出了一种基于并行量子遗传算法的服务质量(QoS)组播路由算法,算法中将各个子群体独立地并行进化,并通过相邻子群体间的信息交换实现克服早熟,避免局部收敛的目的,还提出了一种新的动态旋转角调整策略,使算法具有更好的种群多样性和全局寻优能力.仿真实验表明,新算法在求解性能上优于遗传算法(GA)和采用静态旋转角的量子遗传算法(QGA). 相似文献