应用掩码区域卷积神经网络的文本检测模型 |
| |
引用本文: | 赵小薇,季明辉,徐秀娟,沈家乐.应用掩码区域卷积神经网络的文本检测模型[J].应用科学学报,2023(3):527-540. |
| |
作者姓名: | 赵小薇 季明辉 徐秀娟 沈家乐 |
| |
作者单位: | 1. 大连理工大学软件学院;2. 大连理工大学辽宁省泛在网络与服务软件重点实验室 |
| |
基金项目: | 国家自然科学基金(No.61672128)资助; |
| |
摘 要: | 要:提出一种基于掩码区域卷积神经网络的文本检测模型。首先从扩大模型感受野并尽可能保持模型效率的角度出发,针对残差神经网络中的瓶颈结构进行优化,构建基于结构优化的残差神经网络(residual network based on structural optimization, ResNetSO);然后去除冗余特征以提高融合后特征质量,并将空间注意力机制应用于特征金字塔网络,构建了基于下层特征指导的特征金字塔网络(feature pyramid network based on lower feature guidance,FPNetLFG)。在两个公开数据集上的实验结果表明:包含ResNetSO和FPNetLFG两个模块的模型应用在级联区域卷积神经网络、递归特征金字塔和可切换空洞卷积的目标检测模型中,分别可以带来0.8%和0.3%左右的F1值提升,从而说明了该方法的有效性和普遍适用性。
|
关 键 词: | 文本检测 掩码区域卷积神经网络 主干网络 结构优化 特征金字塔网络 |
|
|