首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
针对目前国内OCR及其文字切分技术主要应用于汉字、英文等文字的识别,而对于少数民族文字,则缺乏较为实用的文字切分工具的问题,提出了基于少数民族文字识别的文字切分方法.该方法以彝文文字为例进行切分,并且采用基于连通域的方法,经实验证明该方法能够取得较好的切分效果.  相似文献   

2.
印刷体蒙古文字识别技术中切分方法的设计与实现   总被引:1,自引:2,他引:1  
文字识别是人工智能的一个重要研究领域.有些民族文字识别的成果已转化为商品化软件.蒙文文字识别的研究还处于起步阶段,蒙古文字的结构和书写方式与其他文种相比有许多特点.印刷体蒙文文字识别技术中字元切分的方法,经过实验其切分正确率在98%以上,并已成功地用于印刷体蒙文识别软件中.  相似文献   

3.
在许多文字识别系统中,字符切分是预处理阶段的重要环节,其目的是从文本图像中分离出字母图像,然后针对切分后的每个字母进行识别。为了达到字符切分的目的首先要切分出文本图像中的每一个连体字母段。本文将彩色图像转换为灰度化的边缘图像,其次对图像进行局域二值化,再进行区域检测,初步实现了图像中维吾尔文字行的定位,然后根据定位结果从图像中切分出文字行,统计切分后的文字行在水平和垂直方向上的像素累计情况,查找最佳切分点,分离出文字行中的字母独立形式或几个字母连成的连体字母段,对后面的字符切分打了很好的基础。实验结果表明,文字行的切分准确率达到92%,字切分准确率达到90%以上。  相似文献   

4.
刘瑛  王绪本 《科学技术与工程》2007,7(21):5584-55895608
简牍图像具有干扰噪声大、文字大小不一的特点,传统的文字切分算法很难准确区分图像中的文字与噪声。针对简牍图像特点,利用投影法进行文字初步切分,运用多种补偿算法对初切分结果进行去噪处理和精确定位。实验结果表明,该算法具有文字切分效果好、运算时间短、易于实现的特点,对简牍图像处理的工程应用具有积极意义。  相似文献   

5.
基于识别反馈的粘连字符切分方法研究   总被引:1,自引:0,他引:1  
字符切分是影响OCR系统识别的关键因素之一.对于中英文混排粘连字符图像,笔者提出了一种基于字符类别的识别反馈的字符切分方法.该方法结构简单,容易实现,实验结果表明该方法切分效果好.  相似文献   

6.
基于地址结构匹配的手写中文地址的切分与识别   总被引:2,自引:0,他引:2  
为了自动识别手写中文地址,提出基于地址结构的汉字字符切分和匹配方法。它将地址行图像过切分为一列子字符图像,对于可能的子字符合并方式进行识别。置信度比较大的词作为关键词搜索地址数据库,得到一系列候选地址。对每个候选地址进行匹配,综合考虑切分、识别和匹配代价给出最终结果。该方法在565个地址行样本上获得了超过91%的地址匹配率。实验表明:该方法能有效地克服传统手写汉字切分方法的不足,减少切分错误,从而提高地址匹配的正确率。  相似文献   

7.
字符切分是影响OCR系统识别的关键因素之一.对于中英文混排文档,提出了基于字符类别的识别反馈混排字符切分方法,利用字符特征分类判别出文档中的汉字类、英文、数字和标点符号类、部件类,对汉字类和部件类借助识别技术分别进行处理.该方法结构简单,客易实现,实验结果表明该方法切分效果好,字符类别判断准确.  相似文献   

8.
文章提出了碑文化对我国传统文化的重大影响,进而阐述了近代碑刻的数字化研究对碑文化的重要作用和价值,然后针对碑刻文字的特点,对碑刻文字进行了计算机识别实验,提出了适合于碑刻文字的识别方法。  相似文献   

9.
基于识别的粘连手写数字串切分系统   总被引:3,自引:0,他引:3  
为解决手写数字串中的粘连问题,提出了一种基于识别的粘连手写数字串切分系统。该系统通过外轮廓分析和投影分析,找出相应的候选切分线。利用候选切分线对数字串过切分,过切分后的每个子图像定义为一个片段,相邻的一个或多个片段的组合定义为一个集团。数字串的每个候选切分结果由一个或多个集团组成。对所有的候选切分结果建立一个概率模型,并使用单个数字识别器对所有集团进行识别。根据最大后验概率准则,选出最优的切分结果。在搜索最优切分结果时,使用剪枝算法,降低了算法的时间和空间复杂度,从而满足实时处理要求。利用从NISTSD19中收集到的样本进行实验,正确切分率高达97.72%。  相似文献   

10.
基于笔划合并的手写体信函地址汉字切分识别   总被引:6,自引:1,他引:6  
为了自动地处理存在着大量的笔划交叉与粘连的实际信函地址行,采用了一种基于笔划提取合并的手写体汉字切分识别方法.对于从实际信函中提取出的单行地址文本图像,首先提取出字符的横、竖、撇、捺等笔划,再根据一定的准则将笔划合并成字根,最终应用与地址解释相结合的动态规划算法得到最终的切分结果,获得投递区域.用从邮政分拣机上获得的443个信函地址行二值图像样本进行测试,省市一级和市县一级投递地址的正确识别率已经达到了66%.  相似文献   

11.
字符切分是影响OCR系统识别的关键因素之一.对于中英文混排粘连搭接字符图像,提出了一种基于识别反馈的字符切分方法.该方法结构简单,容易实现,实验结果表明该方法有较好的切分效果.  相似文献   

12.
基于安卓平台提出了一种对水表图像读数进行自动识别的新方法。水表读数字符分割和识别算法主要包括三部分:(1)利用霍夫变换和一种投票策略检测出水表的外部轮廓,然后基于模板影像和水表中四个红色指针位置,利用仿射变换技术对水表字符区域进行定位;(2)对图像进行预处理和连通区检测,提出一种基于投票策略的方法进行字符分割;(3)在考虑数字字符可能出现粘连噪声和缺失的情况下,使用改进的Tesseract OCR识别引擎对字符进行识别。最终通过NDK编译平台将实现的C++程序移植到Android环境中。经过对100组数据进行系统功能测试,结果表明,水表智能识别系统取得了一定效果,能对水表读数进行比较准确和快速的读取。  相似文献   

13.
针对车牌自动识别系统中的字符分割问题,提出了一种基于车牌字符几何特征的分割字符算法。该方法先用数学形态学对二值化后的车牌图像进行一系列的形态运算,去除掉一些无用信息,使得字符与车牌左右边框、字符与字符之间空懈变大,便于划出字符间的垂直分割线,然后使用一种新的快速测量车牌倾斜度的方法进行校正。实验结果表明,该算法原理简单实用,分割速度快,分割的质量好,便于下一步的识别。  相似文献   

14.
特征抽取是识别中的重要步骤,提取描述性强的特征能够有效提高分类器的识别效率。在提出有关概念的基础上,介绍了特征行抽取在字符过程中的两个重要应用。首先,在分类识别时可用作匹配的特征向量,通过双向匹配来识别独立的字符。其次,可在识别粘连字符时用于预测前端字符,并在提取前端字符后对预测结果进行验证,从而达到准确分割和识别粘连字符的目的。还详细描述了交互确定特征行的方法。最后根据实验数据对字符特征行的应用价值作出了评价。  相似文献   

15.
根据蓝黑车牌的字符排列规则,提出了一种基于活动模板的蓝黑汽车牌照字符切分方法.该方法采用活动模板进行水平坐标的切分,再进一步采用双直线拟合的办法修正各个字符的垂直坐标.试验结果表明该方法对蓝黑车牌的字符切分具有较高的精确度,且满足实时性要求.  相似文献   

16.
基于图像分割的古彝文字识别系统研究   总被引:2,自引:1,他引:1  
介绍了一个古彝文字识别系统实现方案,并重点讨论了图像分割和字符识别,包括图像细化、大小归一化、模板匹配等关键技术.应用MATLAB和C 语言编程实现了上述过程的仿真,仿真结果对古彝文字识别研究具有一定意义.  相似文献   

17.
本文提出一种用于抽取字符骨架特征的预处理方案,以摄象机输入的字符图象先被分割出单个字符.然后用IFA算法阈化为二值图象,经规格化处理成16×12的标准形式后,再用CGT算法进行细化,最后得到字符的单象素宽的骨架.  相似文献   

18.
针对维吾尔词书写粘连和手写笔画漂移等问题,提出一种基于多信息融合路径寻优的字符分割算法.利用笔画提取、切分和聚类,过分割单词图像得到主体和附加字段,通过字段模糊匹配获得鲁棒的字根序列描述,以抑制笔画漂移造成的干扰;由建立的匹配位置高斯模型来估算字段匹配信息,经对单字分类器输出进行置信度转换,从而得到字符识别信息,再运用数据统计获取单词语义信息;由构建的字符序列二阶Markov语言模型,基于Bayes准则,提出了单词后验概率的多信息加权融合计算方法,通过字段匹配及字根合并的路径寻优,可得到最佳字符分割结果.在手写维文样本库上的实验表明,所提算法能有效提升字符分割的准确率和稳定性.  相似文献   

19.
为解决手写汉字文本的自动切分问题,提出了一种基于动态规划的联机手写汉字分割方法.该方法根据手写笔画的结构特征、笔顺信息以及神经网络分类器给出的类概率构造代价函数,并将其分别应用于手写句子的预分割和基于识别的分割过程,然后利用动态规划算法寻找最佳分割路径.预分割在保持较低误分割率的前提下,可以有效地降低候选分割块的数量,以加速分割过程.实验结果表明,预分割的误分割率为0.57%,过分割率仅为11.1%;在未应用语言模型的情况下,最终的正确分割率为88.2%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号