首页 | 本学科首页   官方微博 | 高级检索  
     

基于局部离群因子和波动阈值的古籍版面图像分析方法
作者姓名:贾运  田学东  左丽娜
作者单位:河北大学网络空间安全与计算机学院,保定071002;河北大学网络空间安全与计算机学院,保定071002;河北大学网络空间安全与计算机学院,保定071002
基金项目:国家自然科学基金项目(面上项目,重点项目,重大项目)
摘    要:古籍版面图像结构复杂,对其进行有效、准确的分析是实现古籍汉字识别与检索的前提和基础。对古籍汉字版面分析的关键问题展开研究,在对古籍版面特点进行分析与归纳的基础上,提出基于LOF和波动阈值的古籍版面分析方法。首先,采用基于LOF的分类算法对古籍版面图像投影分割后的区域进行分类,确定存在分割问题的候选混合区域;然后,利用波动阈值对候选混合区域中的文字与框线粘连部分进行分割;最后,确定古籍版面中的文字区域并输出。实验结果表明,该算法能够有效地分离古籍文字区域和框线区域,版面分类和分割准确率分别为87.02%和78.69%。

关 键 词:古籍  版面图像  版面分析  局部离群因子  波动阈值
收稿时间:2019-11-04
修稿时间:2020-06-24
本文献已被 万方数据 等数据库收录!
点击此处可从《科学技术与工程》浏览原始摘要信息
点击此处可从《科学技术与工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号