首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 781 毫秒
1.
版面分析是一个将文本页面图像分割成不同区域,并标定区域类型(如文字、图片、表格等)的过程,与字符识别具有同等重要的地位.提出了一种基于连通域的蒙古文版面分析方法,它提取文档图像中所有连通域,根据连通域的大小进行聚类,从而可以得到文字连通域和非文字连通域,达到分割版面的目的.实验证明,该算法能够对蒙古文书籍版面进行准确的分析.  相似文献   

2.
基于连通域的版面分割研究   总被引:2,自引:2,他引:0  
版面分割是OCR(光学字符识别)系统的重要组成部分,在将印刷文档转换为电子文档的过程中是必不可少的,该文对基于连通域的版面分割方法进行研究,首先用动态聚类法选取模糊阈值,然后对文档图像进行模糊处理,形成大的连通区域,再根据连通域的位置关系等分割出文档的各个分栏,实验表明,该方法对于简单的矩形版面及复杂的版面,例如,非Manhattan版面等都能较好地分割。  相似文献   

3.
贾运  田学东  左丽娜 《科学技术与工程》2020,20(29):12021-12027
古籍版面图像结构复杂,对其进行有效、准确的分析是实现古籍汉字识别与检索的前提和基础。对古籍汉字版面分析的关键问题展开研究,在对古籍版面特点进行分析与归纳的基础上,提出基于LOF和波动阈值的古籍版面分析方法。首先,采用基于LOF的分类算法对古籍版面图像投影分割后的区域进行分类,确定存在分割问题的候选混合区域;然后,利用波动阈值对候选混合区域中的文字与框线粘连部分进行分割;最后,确定古籍版面中的文字区域并输出。实验结果表明,该算法能够有效地分离古籍文字区域和框线区域,版面分类和分割准确率分别为87.02%和78.69%。  相似文献   

4.
一种新的文本预处理方法研究   总被引:2,自引:0,他引:2  
文本预处理是整个字符识别系统的重要组成部分.它的性能的优劣,对整个字符识别系统的识别率和识别速度至关重要.由于汉字印刷文稿版面的复杂性,其文本预处理远比西文困难.本文提出了一种新的文本预处理方法.实现了含有文字字符,图形,图片和表格的、版面结构复杂的数字图象的分割.整个算法分为两个阶段完成:首先,从图形的连通原则出发,定义了扩展连通域的概念,对整个文本图象逐行扫描,搜索出所有的扩展连通域,进而通过集合的交、并操作,将属于一个字符或图象、图片和表格的若干个扩展连通域合并.这时扩展连通域已标记文本图象中的字符尺寸大小和位置.然后,基于同一行字符的间距的知识,将扩展连通域合并为逻辑字符行(横,竖);由字符行的高(宽)度的一致性及间距的知识,将逻辑字符行合并为逻辑块:按照印刷文稿的排版规律完成版面的结构识别、并将标记字符位置和大小的扩展连通域的顺序按版面结构信息重新组合,最后把字符规范为一定尺寸的点阵图象输出到字符识别器.本文提出的文本预处理方法已经实现.经实际运行测试表明,系统对于复杂版面的文件,书刊和报纸的文本图象的分割,具有较好的效果.  相似文献   

5.
为简化版面分割方法、提高检测效率,提出了一种基于稀疏度差异的快速版面分割方法.将稀疏度作为版面区域的特征描述,根据内容及背景区域间稀疏度的差异进行均值分类,得出各区域的类别标签,实现版面分割.在复杂版面图集上得到74.1%的识别率和1.61s的平均计算时间,表明方法有效且快速,较改进的基于连通域的版面分割方法,过程简单,计算简便,具有更好的适用性.  相似文献   

6.
本文提出了基于BDPDL(北大版面描述语言)描述结果的新概念版面远传的设计思想,可使文字信息量减少400倍,整体信息减少25倍。作到高时效,无失真的传送版面。文中还介绍了已完成的利用PES和TES两种地站建成的,以卫星信道为主地面信道为辅的大型版面远传系统。  相似文献   

7.
基于数学形态学的版面分割   总被引:1,自引:0,他引:1  
证明了由连通类$及膨胀运算δ可构造新的连通类$^δ,讨论了$与$^δ的关系,在引人极大连通子集的概念后给出了集合基于连通类的唯一分割,利用集合$^δ的分割与X的膨胀δ(X)基于$的分割之间的对应关系,提出了一种葳地数学形态学的的版面分割方法。  相似文献   

8.
复杂中文报纸的版面分析、理解和重构   总被引:8,自引:0,他引:8  
在将纸张介质的文档自动转换成电子文档格式的过程中 ,版面的分析、理解和重构是十分关键的问题。针对复杂中文报纸版面 ,提出了一个基于最近邻连接强度和行列可信度的自底向上的版面分析算法和一个基于规则的块生长的版面理解算法 ,并讨论版面重构的相关问题和实现。综合这些算法并结合汉字识别核心 ,实现了一个完整的自动电子出版物制作系统。实验和实际运行的系统证明了算法的有效性和系统的实用性  相似文献   

9.
激光标刻的复杂区域填充算法   总被引:1,自引:0,他引:1  
为减少填充线段和提高激光加工效率,对复杂区域的填充算法进行了研究.采用延长某些岛屿边界将包含岛屿的区域变为单连通域;然后用最长边延长法和最长边平行截取法将单连通域分解为简单凸多边形,简单凸多边形填充方法是先找到凸多边形所有边对应的高最小的那条边,平行该边进行填充,最后对填充线段的连接顺序进行优化处理.与传统的固定方向扫描填充相比,采用本算法可使复杂区域和实心文字的激光标刻效率提高20%~40%.  相似文献   

10.
提出了一种基于彩色边缘检测、形态学和逻辑与运算的视频文字提取方法,首先,分别运用垂直、水平、对角三个方向的彩色边缘检测算子提取出原图的边缘图像,然后分别对上述三幅边缘图像进行数学形态学运算,得到三幅不同方向的连通域图。最后,将这三幅连通域图相与,消除无用的信息,得到最终的文字区域。实验证明,该方法具有高的文字提取率和好的鲁棒性。  相似文献   

11.
针对级间分离能源布局设计,通过建立级间分离动力学控制方程并开展解析分析,研究了分离能源布局与箭体转动惯量、质心位置和质量等参数之间的关系,获取了分离能源布局的理论公式,给出了最佳布局位置。结果表明:仿真计算与理论分析一致性较好。可见,研究成果可作为分离能源布局的依据,对提高论证效率、开展分离系统优化设计具有重要的工程意义。  相似文献   

12.
基于提升树的自然场景中文文本定位算法研究   总被引:1,自引:0,他引:1  
提出了一种新的基于提升树算法的自然场景中文文本定位技术.首先利用边缘特征进行文本区域的检测,即对下采样后彩色图像首先进行边缘提取、二值化处理,然后通过形态学运算以及连通区域分析去除大量的非字符连通域,获得候选的文本区域,最后,提取候选文本区域的PHOG-Gabor特征,通过提升树算法进一步确认是否为字符连通域.通过实验验证,该算法具有很高的召回率和准确率,综合性能较高.  相似文献   

13.
为提高版图电路提取效率,提出了一种新的层次式版图电路提取方法.该算法首先对版图进行纵横分析确定各单元的调用类型,并找出单元之间的重叠.然后在单元提取中,取出单元与外界的连接关系,并把这种连接关系映射到上级单元,以进行上级单元的提取.实验结果表明,该算法能有效地处理版图单元之间的任意重叠,包括各种复杂重叠,如多单元重叠以及产生或删除单元晶体管的重叠,同时,它能在有限的内存下提取较大规模的电路.与打散提取相比,在单元重复调用次数较多时,能明显地减少提取时间.  相似文献   

14.
一种基于颜色布局的压缩图像检索方法   总被引:1,自引:1,他引:0  
图像检索技术是多媒体应用中的关键技术。现有的基于内容图像检索技术大都是基于非压缩域的。对于目前普遍存在的压缩格式图像,采用这种技术必须先解压再检索,不但计算量大,而且需占用较多的存储空间,严重影响了检索系统的实时性和灵活性。各种压缩标准的推出与普及促使人们寻求可以直接在压缩域操作的检索技术。本文针对JPEG压缩图像,结合国际标准MPEG-7中建议的颜色布局描述符,提出一种快速的基于DCT域的图像检索方法;实验结果说明,此方法具有检索效率高、检索效果好的特点。  相似文献   

15.
力引导布局算法存在无法展示复杂网络社区结构的缺陷,虽引入聚类的方式来展示社区结构,但社区内节点拥挤且排列无序,不利于观察社区内节点的结构特征与连边关系,为此提出嵌入社区半径的力引导与径向树混合布局算法.该算法首先采用K-means算法对网络节点进行社区划分;然后,用社区内节点数量确定社区半径,并将社区半径嵌入到社区斥力、引力中来展示社区结构;最后,采用径向树布局分层可视化各社区内节点.实验中使用拥挤区域占比、点分布偏差、节点偏差等指标验证了本算法既能降低拥挤度又能减少节点布局偏差,可视化结果显示,本算法布局社区结构明显,节点层次分明,易于理解.  相似文献   

16.
基于粒度分层模型的布局算法   总被引:1,自引:1,他引:0  
研究了问题求解的粒度理论在布局求解中的应用。综合约束问题求解和回溯控制策略,给出了在粒度分层模型基础上的布局算法,以往采用单一粒度模型的布局算法,由于粒度过粗或过细,不能充分利用各种约束来降低求解复杂度。文中提出的算法采用了粒度分层模型,能够利用设计过程不同阶段的约束,来缩小合适解的范围,通过多层面的约束,降低求解的复杂度,克服了以往布局算法的缺陷,通过一个住宅布局设计的实例分析了该算法的运行过程  相似文献   

17.
分析了多工位冲裁级进模工步排样所遇到的各种干涉问题;给出了易于计算机化的工步排样优化设计准则;建立了实用的工步排样优化设计数学模型;提出了高效可靠、能自动完成工步排样优化设计的新方法.还简单介绍了由作者研制开发的“智能型多工位级进模工步排样CAD系统”及其应用实例.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号