首页 | 本学科首页   官方微博 | 高级检索  
     

基于CPU_MIC_GPU异构架构的Roberts算法优化探究
引用本文:洪向共,陈威,熊镝,周辉林. 基于CPU_MIC_GPU异构架构的Roberts算法优化探究[J]. 科学技术与工程, 2016, 16(36)
作者姓名:洪向共  陈威  熊镝  周辉林
作者单位:南昌大学 江西 南昌,南昌大学 江西 南昌,南昌大学 江西 南昌,南昌大学 江西 南昌
基金项目:国家自然科学基金项目(面上项目,重点项目,重大项目)
摘    要:在高分辨率图像日益普及的情况下,Roberts边缘检测的处理速度急需进一步提高。在CPU表现不尽如人意的情况下,基于CPU/GPU和CPU/MIC的高度并行运算的研究愈加深入。在分析Roberts算法特点的基础上,将能并行的部分移植到GPU和MIC上进行。完成基于CPU/GPU和CPU/MIC的异构架构上的Roberts算法实现,并针对CPU/MIC上将程序进行向量化优化。实验结果表明,在相同单精度浮点运算能力下,GPU处理低分辨率图像的速度更快、加速比更高,但处理高分辨率图像时MIC的加速比最高为23.52,高于GPU的21.43。

关 键 词:MIC GPU Roberts边缘检测 Gauss滤波  并行运算 图像处理
收稿时间:2016-06-13
修稿时间:2016-08-18

The Research of Optimized Roberts Algorithm Based on Heterogeneous CPU/MIC/GPU Architecture
Hong Xiang Gong,Chen Wei,Xiong Di and. The Research of Optimized Roberts Algorithm Based on Heterogeneous CPU/MIC/GPU Architecture[J]. Science Technology and Engineering, 2016, 16(36)
Authors:Hong Xiang Gong  Chen Wei  Xiong Di and
Abstract:In the case of the growing popularity of high-resolution images,the Roberts edge detection processing speed urgent need to further improve. Because the disappointing performance of CPU, the height parallel computing research based on the CPU/GPU and CPU/MIC become deepened. On the basis of analysis of the characteristics of Roberts algorithm, the part of the parallel will be respectively transplanted into GPU and MIC. Accomplish the Roberts algorithm which is based on CPU/GPU and CPU/MIC in a Heterogeneous architecture, and optimization the procedure aim at CPU/MIC. Experimental results show that, in the same single-precision FLOPS, the GPU processing low resolution image than faster, higher, but the MIC when dealing with high resolution images faster, speed is higher.
Keywords:MIC   GPU   Roberts edge detection   Gauss filter   parallel computing   image processing
本文献已被 CNKI 等数据库收录!
点击此处可从《科学技术与工程》浏览原始摘要信息
点击此处可从《科学技术与工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号