基于关系感知双重注意力融合的视觉问答技术 |
| |
作者姓名: | 张伟 |
| |
作者单位: | 常州开放大学理工学院,江苏 常州213001 |
| |
摘 要: | 传统视觉问答技术仅采用简单的位置注意力,缺乏语义注意力,从而引起问题推理错误.本文采用双重注意力机制从图像获取位置信息和语义信息,以外积形式进行融合,获得文本也采用双重注意力融合实体和对应关系的信息,帮助理解问题.双重注意力动态方式可以实现关系融合、动态学习,改变传统静态学习方式.以多标签分类器实现答案推理,减少传统二...
|
关 键 词: | 关系感知 双重注意力 视觉问答 |
本文献已被 万方数据 等数据库收录! |
|