首页 | 本学科首页   官方微博 | 高级检索  
     

文档图像分割技术研究
引用本文:付旻,黄祥林,高芸. 文档图像分割技术研究[J]. 中国传媒大学学报, 2006, 13(4): 62-67
作者姓名:付旻  黄祥林  高芸
作者单位:中国传媒大学,计算机与软件学院,北京,100024;中国传媒大学,计算机与软件学院,北京,100024;中国传媒大学,计算机与软件学院,北京,100024
摘    要:在文档图像分析处理中,分割技术十分必要.本文介绍了目前文档图像分割算法中常用的特征和方式,并对针中文文档图像给出了一种分割方法.该方法首先利用Sobel算子粗略检测出文字边缘区域,利用形态学膨胀方法扩展该区域,接着进行了两次颜色聚类分析,最后根据中文字符的特征进行了一系列启发式处理,很好地分割出了文字区域.

关 键 词:文档图像分析  图像分割  文字提取
文章编号:1673-4793(2006)04-0062-06
收稿时间:2005-12-25
修稿时间:2005-12-25

Research on the Technique of Document Image Segmentation
FU Min,HUANG Xiang-lin,GAO Yun. Research on the Technique of Document Image Segmentation[J]. Journal of Communication University of China Science and TEchnology, 2006, 13(4): 62-67
Authors:FU Min  HUANG Xiang-lin  GAO Yun
Abstract:Segmentation is necessary to the analysis and processing of document image. In this paper we introduce some features and approaches which have been used in document image segmentation nowadays, and then propose an algorithm for segmenting Chinese document image. In this method, Sobel operators are first used to detect the text edge regions coarsely~ on which a morphological dilated operation is carried out. After twice color clustering analysis, many heuristics are used based on the features of Chinese character, and text regions are extracted very well at last.
Keywords:document image analysis   image segmentation   text extraction
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号