首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 812 毫秒
1.
王连银 《科技资讯》2007,(14):61-62
本文提出了一种用于识别印刷体汉字字体的方法。首先对汉字的字符图像进行小波分解,然后依据汉字的字型特点,在分解的各子图像上提取汉字基本笔画(横、竖、撇、捺)的能量比例特征。最后依据提取的字体特征进行分类识别,分类器采用MQDF分类器。在包含六种常用字体的样本集上进行了测试,结果表明本文提出的算法能够对单字符字体进行有效地识别。  相似文献   

2.
为解决图像像素表示汉字特征方法不能有效表示汉字本质特征、空间复杂度较高的问题,提出了一种汉字图特征提取方法。方法主要包含汉字图像二值化,汉字图像骨架提取,汉字图特征提取3个部分;二值化消除图像中的噪声,提高图特征提取的准确度;骨架提取保留图像中重要的像素点,剔除无关的像素点;图特征提取将汉字关键点与图数据结构结合来表示汉字形状特征。在3 908个常用汉字的5种字体上进行实验。结果表明,该方法能够正确提取笔画复杂汉字的图特征,有效表示汉字本质特征;不同字体汉字图特征相同的汉字数量最高为3 195个,方法表现较稳定;平均每个汉字可以用22.6个图节点、19.1个边表示,相较于用单通道图像表示汉字特征,可大幅降低空间复杂度。  相似文献   

3.
碎片图像字符特征提取方法研究   总被引:1,自引:1,他引:0  
字符特征提取是含文字碎片图像拼接的关键环节,直接影响拼接效果。提出了一种包含文字信息的碎片图像特征提取方法,首先,对原始碎片图像进行预处理,分别得到字符和碎片背景的二值图像;然后,利用边缘检测算子提取字符和碎片背景的单像素边缘;最后,利用结构算子检测碎片图像中字符与碎片背景边缘的交叉点,并根据交叉点的信息提取字体边缘方向特征。仿真实验结果表明本文提出的碎片图像字符特征提取方法思路合理,能够快速、准确地提取出碎片图像中的字符特征,为后续的匹配拼接奠定基础。  相似文献   

4.
当前应用广泛的光学字符识别(OCR),通常都严重依赖于对图像中灰度信息特征的选自与提取。本文针对汉字字符特征提取,提出一种基于Gabor变换的字符特征提取方法。本方法首先对图像进行归一化处理,再对归一化图像利用Gabor变换计算笔划方向特征,以该特征作为字符的基本特征或者基本特征之一。实验证明该方法提取到的特征对于易混淆的字符和脱机手写字符均具有较好的分类效果。  相似文献   

5.
本汉字系统是在"NEC-PC-8801B"微机系统现有软硬件环境下开发成功的,它不要求增加任何新的硬件开销.本系统包括汉字输入输出模块、常用字内存子库生成模块、子库搜索模块、造字模块和输出格式控制模块等.可输出国标一、二级汉字6763个.打印输出的汉字字体具有纵向和横向扩展功能,字体规格可达几十种.可将字体旋转90度成竖排版格式输出.汉字与可打印的ASCⅡ字符可在同一行内输出,实现中西文兼容使用.  相似文献   

6.
基于最短欧氏距离匹配的印刷体汉字识别   总被引:2,自引:0,他引:2  
印刷体汉字识别有着很高的实用价值,主要工作包括图像预处理、字符的定位分割、图像的特征提取和图像识别,并以Visual Studio 2005作为开发环境实现一个完整的基于最短欧氏距离模式匹配的印刷体汉字识别系统.解决了在字符定位分割时出现的"过分离"问题.经测试,识别率可以达到97.6%,基本符合实际应用要求.  相似文献   

7.
多种印刷字体藏文字符的特征提取方法研究   总被引:5,自引:1,他引:4  
特征提取是文字识别中很重要的环节,传统用于特征提取的方法有模版法、变化特征法、投影直方图法和几何矩特征法等。文章简要介绍和分析了这些传统的特征提取方法及其优缺点,同时,指出了由于藏文字符的特殊性,决定了传统用于特征提取的几种方法在多字体藏文字符特征提取中效果不好的现状,并提出了一种"外围轮廓笔划特征提取法",该方法用于提出多字体的一个外围轮廓笔划的共同特征,效果较好。  相似文献   

8.
特征提取是文字识别中很重要的环节,传统用于特征提取的方法有模版法、变化特征法、投影直方图法和几何矩特征法等。文章简要介绍和分析了这些传统的特征提取方法及其优缺点,同时,指出了由于藏文字符的特殊性,决定了传统用于特征提取的几种方法在多字体藏文字符特征提取中效果不好的现状,并提出了一种“外围轮廓笔划特征提取法”,该方法用于提出多字体的一个外围轮廓笔划的共同特征,效果较好。  相似文献   

9.
一种新的手写体汉字笔划提取方法   总被引:3,自引:0,他引:3  
提出一种新的汉字结构特征提取方法.利用二维小波变换对汉字图像进行分析和处理,分别在其高频子图像中提取汉字的横、竖、撇和捺信息,使结构特征的提取比用其它方法更简单、明晰.  相似文献   

10.
一种基于字符轮廓特征的印刷体汉字切分方法   总被引:1,自引:0,他引:1  
针对单一汉字切分方法的不足,提出一种基于字符轮廓凹凸特征的印刷体汉字切分方法,首先对扫描后的印刷体汉字文本图像进行二值化处理,根据整篇汉字字符的左右轮廓凹凸特征,把字符图像切成一个个的汉字行,最后根据每一个汉字行的字符串上下轮廓凹凸特征,把每一个汉字行切分为单独的汉字字符.仿真实验表明,提出的方法对于标准的纯印刷体汉字文本图像,可以得到比较理想的切分效果.  相似文献   

11.
针对中文漫画图像的特点, 提出一种无监督的中文漫画图像对白自动定位方法, 以满足中文漫画移动阅读的需求。不同于现有基于学习的方法, 该方法不需要训练集, 且具有较强的鲁棒性, 主要包括3个步骤: 1) 利用包围漫画图像文字的空白区域(气泡)的连通性进行气泡检测, 并在气泡中检测完整字符对; 2) 基于字符形状与字符排版规则的一致性, 聚类形成字符行或字符列, 并提取字体特征; 3) 联合多页漫画图像字体特征, 利用贝叶斯分类器检测多页漫画中的剩余字符。在包含900页漫画图像的数据集上进行实验, 结果表明, 该方法可以有效定位中文漫画图像中的对白区域, 取得比较满意的实验结果。  相似文献   

12.
基于地址结构匹配的手写中文地址的切分与识别   总被引:2,自引:0,他引:2  
为了自动识别手写中文地址,提出基于地址结构的汉字字符切分和匹配方法。它将地址行图像过切分为一列子字符图像,对于可能的子字符合并方式进行识别。置信度比较大的词作为关键词搜索地址数据库,得到一系列候选地址。对每个候选地址进行匹配,综合考虑切分、识别和匹配代价给出最终结果。该方法在565个地址行样本上获得了超过91%的地址匹配率。实验表明:该方法能有效地克服传统手写汉字切分方法的不足,减少切分错误,从而提高地址匹配的正确率。  相似文献   

13.
提出一种基于笔端相似性的方法,来解决在较大规模字体集上的单字符字体识别问题.该方法首先提取汉字笔画上的特定部位——笔端,然后利用笔端形状作为汉字的字体特征,对其进行识别.实验证明,该方法不但在常用字体集合上的识别效果优于同类方法,而且在扩展后的大字体集合上也能达到较高的识别率.  相似文献   

14.
介绍一种采用可能性理论与模糊逻辑方法相结合的自动学习分类器设计系统。该系统通过学习抽样字符可测定特征值的可能性。分类器利用模糊逻辑来联合几种特征而计算出全特征组的可能性。在分类器设计中可以自由选择字符类及特征的数量。所描述的印刷体汉字识别包括粗分类及两级精分类。为了克服字符结构变化对特征的影响,在字符点阵中将特征抽取区域的界线模糊化。全系统包括字体分类器及四个单字体分类器。  相似文献   

15.
基于灰度共生矩阵的打印文件检验研究   总被引:1,自引:0,他引:1  
针对打印文件检验在公共安全应用中的需求,提出一种基于灰度共生矩阵的打印文件鉴别方法。鉴别过程包括打印文件图像采集,图像预处理,特征提取和分类判别。用自制装置采集打印文件图像,经预处理后得到单个打印字符,利用灰度共生矩阵方法对不同打印文件中的相同字符进行纹理特征提取,并采用欧氏距离分类器鉴别出源打印机。选取45台激光打印机参与测试,将打印字符的图像灰度级压缩至64级再进行特征提取,鉴别正确率达93.58%,且大幅减少了算法耗时,证明了该方法的有效性。  相似文献   

16.
电子制造业的电路板元件贴片安装检测中,需要根据元件上的字符图像来检测其型号是否正确.现有的整体匹配方法误检率高,且无法检测不同批次字符字体差异的元件.本文设计了位置校正后字符匹配的快速检测方法,对于更换元件批次后的字体差异则采用字符图像分割后进行验证性识别,并重新建模.实验结果表明了本方法具有高效,无漏检,误检率低等特点.  相似文献   

17.
我国字符一般由汉字、英文字母以及阿拉伯数字组成,字符图片的类型众多给字符的识别带来了很多困难.参照目前现有人工智能算法的优点,结合了字符特征提取方法设计了一个改进的BP神经网络对归一化后的三类字符进行识别,取得了预期效果.  相似文献   

18.
提出一种在子块分割和区域划分的基础上, 利用离散余弦变换和奇异值分解对图像进行特征提取的检索算法. 首先对图像进行子块分割, 利用离散余弦变换提取重要系数作为子块颜色特征, 进而对图像进行区域划分, 将每个区域中的子块颜色特征分量组成矩阵进行奇异值分解, 得到该区域的检索特征向量, 从而完成图像检索. 实验结果表明, 该算法取得了较好的查全率和查准率, 具有较好的检索效果.  相似文献   

19.
该文给出一种汉字子笔划的提取方法 ,较好地解决了因子笔划相交 ,使提取的同类字符子笔划不稳定问题。引入了字符的固定部件划分方法及特征矩阵的概念。字符部件中包含各类子笔划的位置、长度等信息 ,特征矩阵是这些信息的集中体现。设计了一种新的遗传算法 ,由未知字符一个部件的一类子笔划表示的字符与某类模型的相似度 ,既由与其它 3类子笔划相应的相似度调节 ,又由与周围部件同类子笔划相应的相似度调节。实验表明 ,该手写体汉字识别方法是有效的  相似文献   

20.
在计算机机械学习领域,相对于数字和英文字母,手写汉字的自动生成研究是个重点难点问题,且具有重要研究意义。随着深度学习的不断发展,生成对抗网络在图像生成领域取得了很大进展。本文提出了一种基于循环生成对抗网络(Cycle Generative Adversarial Networks, CycleGAN)的无监督手写汉字生成方法。利用标准仿宋字体图像和手写字体图像进行训练,生成的手写汉字图像具有比较高的识别度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号