基于深度学习的中文票据文本检测与识别方法 |
| |
作者姓名: | 尹潇伟 孙仁诚 王霄鹏 邵峰晶 王光波 |
| |
作者单位: | 青岛大学计算机科学技术学院 |
| |
基金项目: | 国家自然科学基金(批准号:41706198)资助; |
| |
摘 要: | 针对票据在识别时出现数据漏检率高、识别精度低的问题,提出文本检测模型ENCRAFT与识别模型DLCNN。在文本检测模型CRAFT的基础上,ENCRAFT修改其原始的特征提取网络的结构,利用未经池化的特征图进行融合,减少了细小特征的丢失,并增大监督特征图的分辨率,以提供更丰富的监督信息,从而提高模型检测率;DLCNN利用深层的卷积网络与浅层的循环网络实现对中文票据的高精度识别。实验结果表明,该方法在多个票据数据上的检测率与识别精度均有明显提升。
|
关 键 词: | 光学字符识别 文本检测 票据识别 深度学习 |
|
|