融合时空切片和双注意力机制的视频摘要方法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

融合时空切片和双注意力机制的视频摘要方法

作者姓名：	张云佐郭亚宁李文博

作者单位：	石家庄铁道大学信息科学与技术学院

基金项目：	河北省自然科学基金资助项目(F2022210007)；;河北省高等学校科学技术研究项目(ZD2022100)；

摘要：	为解决现有视频摘要方法的视频帧特征信息提取不充分、摘要结果过分依赖单一特征的问题，提出了一种融合时空切片和双注意力机制的视频摘要方法。在原视频的精准分段阶段，提出了基于时空切片的核时序分割算法(STS-KTS),将视频场景信息反映为时空切片纹理信息，采用水平映射法将预处理后的时空切片投影为一维数组，作为KTS的输入特征；以双注意力机制和分组卷积为基本组件，结合BiLSTM构建时空特征提取网络，以快速提取丰富的时空特征信息，从而配合纹理特征信息消除现有摘要模型对单一特征的过分依赖；采用帧参数预测模块获取最佳的视频帧贡献度分数、中心度分数以及帧序列位置；将帧分数转化为镜头分数，以选取内容丰富的片段，进而生成动态视频摘要。在SumMe和TVSum数据集上的实验表明：所提方法能提高生成摘要的准确性，比现有方法性能更高，尤其在SumMe数据集上的生成摘要准确性相比于现有方法提升了0.58%。
关键词：	视频摘要时空切片双注意力机制时空特征提取深度学习

设为首页 | 免责声明 | 关于勤云 | 加入收藏