基于局部离群因子和波动阈值的古籍版面图像分析方法 |
| |
作者姓名: | 贾运 田学东 左丽娜 |
| |
作者单位: | 河北大学网络空间安全与计算机学院,保定071002;河北大学网络空间安全与计算机学院,保定071002;河北大学网络空间安全与计算机学院,保定071002 |
| |
基金项目: | 国家自然科学基金项目(面上项目,重点项目,重大项目) |
| |
摘 要: | 古籍版面图像结构复杂,对其进行有效、准确的分析是实现古籍汉字识别与检索的前提和基础。对古籍汉字版面分析的关键问题展开研究,在对古籍版面特点进行分析与归纳的基础上,提出基于LOF和波动阈值的古籍版面分析方法。首先,采用基于LOF的分类算法对古籍版面图像投影分割后的区域进行分类,确定存在分割问题的候选混合区域;然后,利用波动阈值对候选混合区域中的文字与框线粘连部分进行分割;最后,确定古籍版面中的文字区域并输出。实验结果表明,该算法能够有效地分离古籍文字区域和框线区域,版面分类和分割准确率分别为87.02%和78.69%。
|
关 键 词: | 古籍 版面图像 版面分析 局部离群因子 波动阈值 |
收稿时间: | 2019-11-04 |
修稿时间: | 2020-06-24 |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《科学技术与工程》浏览原始摘要信息 |
|
点击此处可从《科学技术与工程》下载免费的PDF全文 |
|