首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
基于地址结构匹配的手写中文地址的切分与识别   总被引:2,自引:0,他引:2  
为了自动识别手写中文地址,提出基于地址结构的汉字字符切分和匹配方法。它将地址行图像过切分为一列子字符图像,对于可能的子字符合并方式进行识别。置信度比较大的词作为关键词搜索地址数据库,得到一系列候选地址。对每个候选地址进行匹配,综合考虑切分、识别和匹配代价给出最终结果。该方法在565个地址行样本上获得了超过91%的地址匹配率。实验表明:该方法能有效地克服传统手写汉字切分方法的不足,减少切分错误,从而提高地址匹配的正确率。  相似文献   

2.
基于笔划合并和动态规划的联机汉字切分算法   总被引:4,自引:0,他引:4  
联机手写汉字识别已从单字识别走向多字,乃至整篇文档的识别,字符的正确切分很大程度上决定了系统的性能.为了提高系统对整页文档的切分识别性能,该文提出了一种联机手写汉字的切分算法.通过基于规则的笔划合并将单个笔划合并成字符块,在此基础上,采用动态规划算法,利用字符块的长宽比、大小、间距以及识别信息,寻找出最优的切分路径.同时,对于手写汉字的任意性,提出了一种对汉字外接矩形框进行裁减的调整算法,使外接框并不包含整个汉字.实验证明,该文所提出的算法对于字数较多的多行样本以及存在字符相互粘连的情况,都有着很好的效果.  相似文献   

3.
基于数学形态学的图像汉字笔划细化和提取   总被引:1,自引:0,他引:1  
文章提出了一种基于数学形态学的图像汉字笔划细化和提取方法。根据汉字的结构特点,定义了一组新的结构元素序列,保持了原样本图像汉字的连通性和拓扑性的骨架,有效地抑制样本细化后汉字笔划的扭曲和歪斜;在此细化的结果基础上,定义了一种新的汉字笔划提取算法,准确提取出原汉字的横竖撇捺笔划的形状、形态及形式结构信息,取得了理想的效果。  相似文献   

4.
针对古籍文献版面图像切分中存在的过切分和粘连等问题,提出基于犹豫模糊集的古籍汉字图像切分方法。首先,对古籍汉字版面图像进行连通区域搜索,获取版面中的笔画部件,实现古籍汉字的初切分;然后,对过切分汉字进行特征分析,提取过切分区域的特征,利用犹豫模糊集在处理多属性决策问题方面的优势,通过建立犹豫模糊集来判断过切分区域归属同一古籍汉字的隶属度,并据此进行过切分区域的合并;最后,对存在粘连和重叠的汉字采用分段像素跳跃数突变分析方法进行分割。在28 886个古籍汉字上的实验结果显示,可以达到92. 3%的切分准确率和85. 7%的过切分合并准确率。  相似文献   

5.
现有的光学印刷体汉字识别(OPCCR)系统中,汉字识别率虽然已经高达98%以上,但仍然会发生错误识别的情况.通常,这些错误的识别还不能被自动检测,采用人工检测,费时费力,大大降低了实际应用系统的自动化和智能化程度.为此,本论文提出了基于网格笔划密度特征的OPCCR错误的自动检测算法.本算法首先建立标准汉字的网格笔划密度特征的特征库.然后,在OPCCR错误的自动检测时,对光学印刷体汉字图像进行预处理、行分割、列分割得到单个汉字图像,提取单个汉字图像的网格笔划密度特征.再把特征和相应的识别出的汉字的特征库中的特征进行相关匹配.于是,根据特征匹配自动检测OPCCR的错误.  相似文献   

6.
基于笔划方向特征和非对称分布的手写体汉字识别模型,提出一种从手写体汉字骨骼图像上提取分叉点的有效改进算法,保证笔划提取的可靠性,并直接从笔划结构上计算统计识别特征矢量;采用主向量空间的非对称参数分布模型计算距离测度.实验表明,基于笔划方向特征和非对称分布的统计识别模型具有优良的识别性能.  相似文献   

7.
在分析传统手写汉字文本切分算法利弊的基础上 ,提出了一种改进的基于快速连通域提取的切分算法 ,算法具有很强的抗干扰能力 ,有效解决了小角度歪斜图像和笔画粘连字符的汉字切分问题 .同时给出了具体的实现方法  相似文献   

8.
基于笔画分析和背景细化的粘连手写汉字切分   总被引:5,自引:0,他引:5  
离线手写汉字的切分是识别的前提,其中粘连手写汉字的切分最为困难。提出一种基于笔画分析和背景细化的粘连手写汉字的切分新方法。对粘连字符图像作细化处理,检测端点、叉点和角点等特征点,根据特征点提取笔段。按笔段的长度、相互之间的位置关系以及投影信息确定切分点。细化粘连字符的背景图像,从切分点出发在细化的背景中选取分割路径,实现粘连手写汉字的切分。实验表明,本方法对于粘连手写汉字具有令人满意的切分效果。  相似文献   

9.
一种基于字符边界的细化算法   总被引:5,自引:0,他引:5  
字符图像细化能极大地消除图像中的冗余信息量,大大简化字符识别特征的提取过程,提高字符识别的准确性和快速性.对字符进行细化,是字符识别的前提.提出了一种利用字符边界细化字符的算法,每一步都针对单个像素点作处理,并提取笔划单侧边缘点序列作为字符图像骨架.实验结果表明:该算法能较好地保留字符图像的基本信息,快速地去除字符图像中冗余的像素点,有效地解决了交叉点分离,笔段变短等问题,并为连笔笔划的切分提供了有效的方法,具有较好的细化结果.  相似文献   

10.
在许多文字识别系统中,字符切分是预处理阶段的重要环节,其目的是从文本图像中分离出字母图像,然后针对切分后的每个字母进行识别。为了达到字符切分的目的首先要切分出文本图像中的每一个连体字母段。本文将彩色图像转换为灰度化的边缘图像,其次对图像进行局域二值化,再进行区域检测,初步实现了图像中维吾尔文字行的定位,然后根据定位结果从图像中切分出文字行,统计切分后的文字行在水平和垂直方向上的像素累计情况,查找最佳切分点,分离出文字行中的字母独立形式或几个字母连成的连体字母段,对后面的字符切分打了很好的基础。实验结果表明,文字行的切分准确率达到92%,字切分准确率达到90%以上。  相似文献   

11.
运用民俗语言文化的研究方法,通过较详实的语言资料,认为:用拆字和改字手段形成的文字造词法是汉民族语言所独具的一种造词方式.指出:现代语言研究应真正深入到历代社会民间俚俗语言的源头活水之中,从而在汉语造词法体系中给文字造词法一个应有的科学定位.  相似文献   

12.
图像目标空间关系的描述是基于内容的图像检索中的关键技术,通过空间位置关系识别事物更符合人们的习惯.回顾并比较了图像中的目标空间关系的特征及描述方法,指出了存在的问题,并提出了改进的建议.  相似文献   

13.
图像空间关系特征描述   总被引:1,自引:0,他引:1  
图像目标空间关系的描述是基于内容的图像检索中的关键技术,通过空间位置关系识别事物更符合人们的习惯.回顾并比较了图像中的目标空间关系的特征及描述方法,指出了存在的问题,并提出了改进的建议.  相似文献   

14.
汉字是中华文化的瑰宝,它承载着中华文明,记录着悠久历史,是中华民族智慧的集中体现。前不久,关于汉字的电视节目《汉字听写大会》轰动一时,引发了广泛的关注,让人们逐渐认识到我们的汉字教育长期以来都没有得到应有的重视,汉字使用和汉字教育存在问题。  相似文献   

15.
字符切分是影响OCR系统识别的关键因素之一.对于中英文混排粘连搭接字符图像,提出了一种基于识别反馈的字符切分方法.该方法结构简单,容易实现,实验结果表明该方法有较好的切分效果.  相似文献   

16.
设G和H是两个有限的π-可分群,在这篇文章中,我们证明了:若G和H同构,则它们的π-special特征标集合之间存在双射;特别地,我们将著名的Brauer置换引理推广到了特征标的π-理论上。  相似文献   

17.
张立忠 《科学技术与工程》2012,12(32):8553-8557
提出了一种基于中英文字符型属性的数据库数字水印算法。通过元组哈希值和字符属性值长度计算出预测嵌入位置,根据预测嵌入位置所在的字节序号确定水印嵌入位置。以ASCII字符集的不可见字符作为水印信号,将版权图像嵌入宿主数据库。嵌入的水印信号具有不可见性,并且保持数据库的原始可用性,可实现水印的盲提取。该算法对添加元组、删除元组、修改属性值、添加与删除属性以及元组与属性重排等常见数据库攻击具有较强的鲁棒性。  相似文献   

18.
提出了一种基于中英文字符型属性的数据库数字水印算法。通过元组哈希值和字符属性值长度计算出预测嵌入位置,根据预测嵌入位置所在的字节序号确定水印嵌入位置。以ASCII字符集的不可见字符作为水印信号,将版权图像嵌入宿主数据库。嵌入的水印信号具有不可见性,并且保持数据库的原始可用性,可实现水印的盲提取。该算法对添加元组、删除元组、修改属性值、添加与删除属性以及元组与属性重排等常见数据库攻击具有较强的鲁棒性。  相似文献   

19.
徐剑峰  吴一全  周建江 《应用科技》2006,33(9):37-40,47
SSDA算法(序贯相似性检测)是针对一般模板匹配算法计算量大而提出的减少计算量的误差累计算法.但它同样需要依据图像之间的像素点对进行计算,从而对字符图像的变形敏感.在从事车牌自动识别课题研究中应用SSDA算法进行字符识别过程中,为了减小字符图像变形,在字符倾斜校正、字符二值化、字符切分和字符归一化过程中都围绕其加以改进或提出新算法.  相似文献   

20.
新时期的高校图书馆服务,具有自主性、知识性、教育性、服务性和效益性等方面的新特性,是“以我为主,知识为源,教育为本,服务为形,追求效益”的服务。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号