首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于RGB-D图像和深度学习的场景语义分割网络
引用本文:代具亭,汤心溢,刘鹏,邵保泰.基于RGB-D图像和深度学习的场景语义分割网络[J].科学技术与工程,2018,18(20).
作者姓名:代具亭  汤心溢  刘鹏  邵保泰
作者单位:中国科学院上海技术物理研究所,中国科学院上海技术物理研究所,中国科学院上海技术物理研究所,中国科学院上海技术物理研究所
基金项目:国家十三五国防预研项目(Jzx2016-0404/Y72-2),中国科学院青年创新促进会(2014216),上海市现场物证重点实验室基金资助项目(2017xcwzk08)
摘    要:近年来,深度卷积神经网络应用于图像语义分割领域并取得了巨大成功。本文提出了一个基于RGB-D(彩色-深度) 图像的场景语义分割网络。该网络通过融合多级RGB网络特征图和深度图网络特征图,有效提高了卷积神经网络语义分割的准确率。同时,本文利用带孔的卷积核设计了具有捷径恒等连接的空间金字塔结构来提取高层次特征的多尺度信息。在SUN RGB-D数据集上的测试结果显示,与其它state-of-the-art的语义分割网络结构相比,本文所提出的场景语义分割网络性能突出。

关 键 词:RGB-D  卷积神经网络  语义分割  特征融合  空间金字塔
收稿时间:2018/1/23 0:00:00
修稿时间:2018/3/29 0:00:00

Scene Parse Network based on RGB-D Image and Deep Learning
Dai Ju Ting,and.Scene Parse Network based on RGB-D Image and Deep Learning[J].Science Technology and Engineering,2018,18(20).
Authors:Dai Ju Ting  and
Institution:Shanghai Institute of Technical Physics of the Chinese Academy of Sciences,,,
Abstract:In recent years, deep convolutional neural networks have been applied to the field of image semantic segmentation and achieved great success. This paper presents a scene semantic segmentation network based on RGB-D(RedGreenBlue-Depth) images. The network effectively improves the accuracy of semantic segmentation of convolutional neural networks by merging multi-level RGB network features and depth network features. At the same time, this paper using convolution kernels with holes designs a spatial pyramid structure with shortcut to extract high-level features of multi-scale information. The test results on the SUN RGB-D dataset show that, compared with other state-of-the-art semantic segmentation networks, the performance of the semantic segmentation network we propose in this paper is outstanding.
Keywords:RGB-D  CNN  Semantic Segmentation  Feature fusion  Spatial Pyramid
点击此处可从《科学技术与工程》浏览原始摘要信息
点击此处可从《科学技术与工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号