基于CNN-RNN深度学习的图片描述方法与优化 |
| |
引用本文: | 陈虹君,罗福强,赵力衡,张杰,李瑶.基于CNN-RNN深度学习的图片描述方法与优化[J].湘潭大学自然科学学报,2018(2):67-70. |
| |
作者姓名: | 陈虹君 罗福强 赵力衡 张杰 李瑶 |
| |
作者单位: | 四川大学锦城学院电子信息学院;四川大学图像研究所 |
| |
摘 要: | 为了提高模型的泛化能力,将机器翻译的编-解码模型引入图片描述中.首先,提出了CNN-RNN模型:CNN负责编码,RNN负责解码,RNN模型采用LSTM网络.接着,考虑到该模型一定程度上忽略了图片的局部区域特征和图片语义信息,因此又提出改进的CNN-MIL-DRN模型.该模型考虑了属性概率向量,并将多个时刻状态堆叠在一个时刻的计算中,加深了非线性变换的复杂深度.最后,采用MS COCO C5进行模型测试,以AP及5个不用的阈值测试不同指标,同时选取一些目前较新的模型作对比,从而得到CNN-MIL-DRN模型的最优效果.
|
关 键 词: | 神经网络 CNN RNN MIL LSTM DRN |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《湘潭大学自然科学学报》浏览原始摘要信息 |
| 点击此处可从《湘潭大学自然科学学报》下载免费的PDF全文 |
|