首页 | 本学科首页   官方微博 | 高级检索  
     

海蓝目录自动识别系统的设计
引用本文:梁莹,施善旦. 海蓝目录自动识别系统的设计[J]. 广西科学院学报, 2004, 20(4): 284-286
作者姓名:梁莹  施善旦
作者单位:广西计算中心,广西,南宁,530022;广西计算中心,广西,南宁,530022
摘    要:设计海蓝目录自动识别系统。该系统在获取已预处理过的目录图像之后,对图像进行版面分析,利用OCR技术识别文字,并自适应地获取目录的缩进量作为判断目录层次的依据,最后通过目录提取和人工校正得到统一的目录格式。该系统具有自动识别、提取书籍目录结构等功能,能有效地处理多种格式的书籍目录类型。

关 键 词:目录识别  OCR  版面分析  缩进量  目录提取  人工校正
收稿时间:2004-09-30
修稿时间:2004-09-30

Design of Highland Catalog Auto-Recognition System
Liang Ying and Shi Shandan. Design of Highland Catalog Auto-Recognition System[J]. Journal of Guangxi Academy of Sciences, 2004, 20(4): 284-286
Authors:Liang Ying and Shi Shandan
Affiliation:Guangxi Computing Center, Nanning, Guangxi, 530022, China and Guangxi Computing Center, Nanning, Guangxi, 530022, China
Abstract:Highland catalog auto-recognition system is proposed,which can handle various styles of catalog images, and its key technical characteristics are described.This system firstly analyzes the content of the catalog in the preprocessed images,then uses OCR technique to recognize the characters,then exploits the relative indent to get the hierarchical structure of the catalog,which is corrected manually to get the unified catalog format.
Keywords:catalog recognition   OCR   layout analysis  indent   catalog extraction   manual correction
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《广西科学院学报》浏览原始摘要信息
点击此处可从《广西科学院学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号