首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 250 毫秒
1.
一种基于字符轮廓特征的印刷体汉字切分方法   总被引:1,自引:0,他引:1  
针对单一汉字切分方法的不足,提出一种基于字符轮廓凹凸特征的印刷体汉字切分方法,首先对扫描后的印刷体汉字文本图像进行二值化处理,根据整篇汉字字符的左右轮廓凹凸特征,把字符图像切成一个个的汉字行,最后根据每一个汉字行的字符串上下轮廓凹凸特征,把每一个汉字行切分为单独的汉字字符.仿真实验表明,提出的方法对于标准的纯印刷体汉字文本图像,可以得到比较理想的切分效果.  相似文献   

2.
介绍了一种按照TrueType字库格式对手写汉字提取字形轮廓的算法,包括手写汉字轮廓数据的获取、轮廓的有序化以及轮廓字形特征点的提取等主要步骤.实验表明,该算法效果良好,提取出的字形轮廓可以写入Windows集外字TrueType字库,自动生成TrueType字模.  相似文献   

3.
本文提出一种手写印刷体汉字识别方法,使用该方法无需先对汉字进行细化和平滑处理。利用汉字笔划的相关性,抽取汉字图像的结构特征.在特征抽取过程中,考虑到一些噪声的影响,因而对质量较低劣的汉字识别也有效。实验结果较满意。  相似文献   

4.
现有的光学印刷体汉字识别(OPCCR)系统中,汉字识别率虽然已经高达98%以上,但仍然会发生错误识别的情况.通常,这些错误的识别还不能被自动检测,采用人工检测,费时费力,大大降低了实际应用系统的自动化和智能化程度.为此,本论文提出了基于网格笔划密度特征的OPCCR错误的自动检测算法.本算法首先建立标准汉字的网格笔划密度特征的特征库.然后,在OPCCR错误的自动检测时,对光学印刷体汉字图像进行预处理、行分割、列分割得到单个汉字图像,提取单个汉字图像的网格笔划密度特征.再把特征和相应的识别出的汉字的特征库中的特征进行相关匹配.于是,根据特征匹配自动检测OPCCR的错误.  相似文献   

5.
为丰富计算机字库,传承中国文化,减少人工手写工作量和汉字图像字库的存储量,提出了一种基于部件融合的“我”体个性字库的建立的方法。该方法通过提取个人手写稿的部件与352个部件匹配,由Gabor小波提取部件特征,利用仿射变换和图象卷绕来实现部件融合为“我”体汉字。试验表明,该方法可行,在减少人工手写工作量和降低汉字图像字库的存储量上具有显著的优点。  相似文献   

6.
通用型汉卡及配套的汉字处理软件是我国科技人员经多年潜心研制的。该汉卡装有国标16×16(GB51998型)及24×24(GB5007C型)ROM(共6M位)两种字库,用于汉字显示及打印,它们不占内存,与各种显示器及控制板兼容,提高了显示和打印速度,还安装四个EPROM(每个32k字节),采用地址覆盖技术及软件设置地址技术,以适应不同系统配置和占用最小内存,可放数据(输入码表)或程序,它与其他汉卡比较,具有易学易用、操作简便、适应机型广、输入方法多、速度快,打印功能全及价格便宜等优点,对初学者甚为方便,大大提高了工作效率,受到国内外用户的好评。配套的汉字处理系统主要特点是:  相似文献   

7.
针对图像在采集过程中会受到物体表面反射及噪声等影响所造成的图像特征提取效果不佳及用整幅图像的像素点进行计算导致的运算量大、精度低等问题,提出了一种基于标记点的配准方法.该方法利用链码的概念,首先对图像进行预处理,提取出标记点质心坐标并根据提取出的质心坐标形成链码;其次,将质心链码做一阶差分形成差分链码,通过差分链码的旋转和平移的不变性得到配准点对对链码进行配准;最后,通过点对坐标计算旋转角度和平移参数.实验结果表明提出的方法对于图像平移和旋转情况下配准精度高,有较强的抗噪声性能并能达到很好的精度.  相似文献   

8.
为解决图像像素表示汉字特征方法不能有效表示汉字本质特征、空间复杂度较高的问题,提出了一种汉字图特征提取方法。方法主要包含汉字图像二值化,汉字图像骨架提取,汉字图特征提取3个部分;二值化消除图像中的噪声,提高图特征提取的准确度;骨架提取保留图像中重要的像素点,剔除无关的像素点;图特征提取将汉字关键点与图数据结构结合来表示汉字形状特征。在3 908个常用汉字的5种字体上进行实验。结果表明,该方法能够正确提取笔画复杂汉字的图特征,有效表示汉字本质特征;不同字体汉字图特征相同的汉字数量最高为3 195个,方法表现较稳定;平均每个汉字可以用22.6个图节点、19.1个边表示,相较于用单通道图像表示汉字特征,可大幅降低空间复杂度。  相似文献   

9.
本文提出一种用于手写印刷体汉字识别的笔划抽取方法.输入的手写印刷体汉字经细化预处理后,对之进行分析,抽取各种特征点和线段,然后通过一个产生式系统形成和识别10种结构笔划.用Pascal语言编程的一个实验系统在一台微型计算机上运行.本文给出初步实验结果并对其加以分析.  相似文献   

10.
二级印刷体汉字的识别   总被引:1,自引:0,他引:1  
本文提出了一种利用数学形态学提取汉字结构特征进行汉字识别的方法。该方法模仿人的认字过程,根据汉字构造的基本规律选取字的边框特征和局部特征,所取特征可适用于多体印刷体汉字的识别。用传真机输入的6763个二级汉字进行了实验,分类稳定,正确识别率为95.2%。  相似文献   

11.
一种有效的多字体印刷字符识别系统实现   总被引:1,自引:0,他引:1  
提出了一种基于神经网络和浮动模板的多字体印刷字符识别方法。在研究大量的多字体印刷字符图像后,给出了一种有效的预处理方法,并在综合抽取宏观特征与微观特征后,送入神经网络的浮动模板法分类器进行识别。实验证明该方法具有相当高的识别率,应用前景十分广泛。  相似文献   

12.
提出了一种基于神经网络和浮动模板的多字体印刷字符识别方法。在研究大量的多字体印刷字符图像后,给出了一种有效的预处理方法,并在综合抽取宏观特征与微观特征后,送入神经网络的浮动模板法分类器进行识别。实验证明该方法具有相当高的识别率,应用前景十分广泛。  相似文献   

13.
在对计算机的汉字识别方法讨论分析之后,本文以汉字的结构特征为基础,提出了一个新的笔划跟踪搜索方法,用来解决手写体汉字的识别问铱,在该方案中采取了速度快、质量好的平滑细化等预处理方法。在特征抽取中采用了定向记忆跟踪和笔划拼接二种方法,从而解决了在笔划抽取中,特别是在笔划经过细化处理后,不可避免地带来某种程度的笔划畸变的情况下,如何正确地抽取笔划特征,找到了一个较完善的处理方法。经过大量的计算机实验,证明该方法切实可行。且已使正确识别率提高到95%以上,误认率低于5%,识别速度小于2秒。  相似文献   

14.
印刷体蒙古文字识别技术中切分方法的设计与实现   总被引:1,自引:2,他引:1  
文字识别是人工智能的一个重要研究领域.有些民族文字识别的成果已转化为商品化软件.蒙文文字识别的研究还处于起步阶段,蒙古文字的结构和书写方式与其他文种相比有许多特点.印刷体蒙文文字识别技术中字元切分的方法,经过实验其切分正确率在98%以上,并已成功地用于印刷体蒙文识别软件中.  相似文献   

15.
基于Gabor函数的汉字字体识别   总被引:5,自引:0,他引:5  
汉字字体识别是当前中文OCR系统需进一步解决的问题之一,字体信息属于汉字笔画上的微细结构部分,抗干扰能力差,这样基于局部微细结构分析的方法是具有较大难度的.这里采用了一种新的基于Gabor函数的全局纹理分析的识别方法.在实验中选用了汉字4种常用标准印刷字体(宋、仿宋、黑、楷)的样张,以证实这种方法的有效性.  相似文献   

16.
一种基于噪声信道模型的汉字识别后处理新方法   总被引:3,自引:0,他引:3  
利用上下文关系进行汉字识别后处理时 ,若候选字集中不含有正确字符 ,文本识别率的提高会受到很大限制。基于单字识别系统的噪声信道模型 ,文中提出一种扩充候选字集的方法 ,利用单字识别给出的候选字来推测可能正确的字 ,并将它们与识别候选字进行集成 ,得到新的候选字集。30 0套脱机手写体样本的测试表明 ,新候选字集的 5 0选平均错误率较原先的识别候选字集下降了 37.88%。脱机手写体文本 (约 8万字 )识别后处理中 ,语言模型为基于字的bigram时 ,文本平均识别率从扩充候选字之前的 93.93%提高至 95 .82 % ,错误率下降了 31.14%。  相似文献   

17.
兼顾连笔和笔顺的联机手写汉字识别方法   总被引:4,自引:0,他引:4  
为解决联机手写汉字识别技术中兼顾连笔和笔顺的难题,提出了联机手写汉字的模糊属性关系图描述和基于知识的松驰匹配方法。该方法能充分描述汉字结构、对手写变形不敏感,并具有良好的连笔字识别能力和适应不同笔顺的特点。基于上述方法,作者实现了一个联机手写汉字识别系统。实验结果表明,本方法能够有效地增加对于低限制书写汉字的识别正确率,并具有较好的抗噪声能力。经过22530汉字测试,首位识别率达98.8%,前十位识别率达99.7%。  相似文献   

18.
提出一种基于文字结构特征的神经网络手写汉字识别策略 ,根据所提取的文字笔画方向、基本轮廓和交叉点等特征 ,采用基于自组织神经网络的模式聚类该方法完成正规手写文字的识别 .该方法提取的笔画轮廓十分准确有效 ,对手写汉字的约束少 ,可识别的汉字数量大 ,在仿真实验中有效地识别了绝大多数手写汉字  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号