首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 375 毫秒
1.
基于识别反馈的粘连字符切分方法研究   总被引:1,自引:0,他引:1  
字符切分是影响OCR系统识别的关键因素之一.对于中英文混排粘连字符图像,笔者提出了一种基于字符类别的识别反馈的字符切分方法.该方法结构简单,容易实现,实验结果表明该方法切分效果好.  相似文献   

2.
基于轮廓结构和统计特征的字符识别研究   总被引:4,自引:0,他引:4  
车牌识别系统是智能交通不可缺少的一部分,在车牌识别系统中,字符的特征提取和字符识别是这一系统的关键技术.文章利用字符的轮廓结构特征和统计特征对字符进行识别,根据字符外部轮廓的上、下、左、右4个方向的特点和一些统计特征,如字符最大宽度,垂直方向笔画数等作为识别特征,形成判别树,再利用判别树对汽车牌照中的数字和字母进行识别.此方法识别的准确率比较高,并提高了识别速度,还适用于其他不同字体的数字和字母识别.  相似文献   

3.
字符切分是影响OCR系统识别的关键因素之一.对于中英文混排文档,提出了基于字符类别的识别反馈混排字符切分方法,利用字符特征分类判别出文档中的汉字类、英文、数字和标点符号类、部件类,对汉字类和部件类借助识别技术分别进行处理.该方法结构简单,客易实现,实验结果表明该方法切分效果好,字符类别判断准确.  相似文献   

4.
薛倩 《河南科学》2014,(5):781-784
为了解决车牌图像倾斜、背景复杂、分割过程中出现的字符间粘连、断裂等问题,提出简便有效抗干扰强的基于字符块提取的车牌字符分割算法,以此提升车牌字符的识别效果.通过车牌图像二值化处理、倾斜矫正、去除干扰以及字符块提取一系列步骤,实现车牌识别前对车牌字符的准确有效分割.实验结果表明,该车牌字符分割方法可靠、准确度高,为后续车牌字符的正确识别奠定基础.  相似文献   

5.
实现了深度学习的民国纸币序列号自动识别系统.提取、分割民国纸币序列号字符,对单个字符进行预处理,裁剪字符空白区域,归一化字符大小,并使用卷积神经网络进行识别.实验结果表明:在纸币存在污迹、褶皱的情况下,所提民国纸币序列号识别系统能够减少人工录入的工作量,单个字符的识别精度高于99.99%.  相似文献   

6.
为了解决集装箱箱号识别精度差、速度慢的缺点,提出了一种新的识别方法.该方法从字符的边界信息中抽取出其特征向量并利用模板匹配法完成字符的初步识别.然后通过大量的实验确定易混淆的字符集,再利用这些字符的独有特征加以区分识别.实验结果表明此算法不但减少了运算量,而且提高了识别速度和精确度.  相似文献   

7.
给出了一种提取与识别工程图形扫描图像中的尺寸字符的方法,提出了几种简便、易于抽取的字符结构特征,能有效地识别工程图形扫描图像中的手写字符.该方法已成功地应用到工程图形扫描输入后的智能识别软件CIRS5.0中,字符提取及识别率达到92%以上.  相似文献   

8.
作为区分人机操作的一种有效方法,验证码图片被广泛使用.通过对验证码图片识别技术的研究,可以及时发现和改善验证码漏洞.识别混合字符型文本类型验证码的关键是提取验证码图像中的单个字符.介绍验证码识别的一般过程,给出基于颜色提取单个字符和基于支持向量机分割为单个字符的两种单个字符提取方法,通过实例给出了详细步骤.  相似文献   

9.
数学公式识别在拍照搜题、自动阅卷和题库建设等智慧教育任务中有着广泛的应用.由于这些应用中数学公式大多以图片的形式存在,因此识别图片中的数学公式成为智慧教育领域的重要研究问题之一.数学公式结构复杂,从图片中识别数学公式远比一般的光学符号识别要复杂得多.将公式识别分为字符分割、符号识别和公式重组这3个步骤:首先,综合运用投影和连通域方法将字符从图片中分割出来;其次,基于单个字符的区域像素数占总像素比例提取字符特征,建立监督学习模型识别字符;最后,利用每个字符在公式中出现的位置对数学公式进行重组.真实数据集上的实验结果表明,本文提出的数学公式识别方法准确率高达98.0%.  相似文献   

10.
基于神经网络的机动车号牌字符识别   总被引:7,自引:1,他引:6  
以定位、 分割后的机动车号牌字符为研究对象. 首先, 对机动车号牌图像进行大小、 灰度方差、 灰度均值的标准化处理. 其次, 根据机动车号 牌字符的特点, 抽取字符3种不同的特征, 构造3个BP神经网络对机动车号牌字符进行识别. 并根据字符在机动车号牌中所处位置的差异, 在每个BP神经网络中构造4种不同的子网络分 别进行训练和识别. 最后, 每个BP神经网络的输出通过加权求和的组合方式得到最终识别结 果. 在组合各网络输出前, 采用对字符图像求取局部二阶差分值的方法, 将字形相近的字符 进行再分类, 从而有效地降低误识率. 通过分析实验结果, 表明本算法在机动车号牌识 别应用中达到了理想的识别效果.  相似文献   

11.
异体字同假借字、古今字、繁简字,属经典文献中常见的四类用字现象之一,也是古代汉语课程教学中绕不开的内容。从字用角度出发,通过字形结构的分析,分析记词功能相同的异体字之间的异同,这对提升阅读效率,提高古代汉语水平同样有着重要的影响。  相似文献   

12.
QR code二维条码数据编码的研究   总被引:2,自引:0,他引:2  
为了实现二维条码的超大容量和高效汉字表示,应用快速响应矩阵码(QR code)进行编码.QR code码可以对任何类型数据,如数字、字母、字节以及汉字等进行编码.汉字模式下输入字符被压缩成13 bit二进制数,然后将二进制数连接起来,并在前面加上模式指示符、汉字子集指示符和字符计数指示符.在对输入数据进行汉字编码时,发现国家标准(GB/T 18284-2000)中存在错误,生成的数据位流超出国标中规定的符号数据容量.提出了3种修订方法,修改了国标中汉字模式的数据容量.测试结果表明所提方法是可行和有效的.  相似文献   

13.
汉字是表义文字,从汉字的体制看,汉字有语素字和非语素字,从汉字的字音看,汉字不光有单音字,还有许多多音字,从汉字的形体看,汉字是由笔画构成的,有不少汉字的形体相近或相似,构成了形近字。这些语素字、非语素字、多音字和形近字出现在普通话水平测试(PSC)的单字试题中,用来检测应试者的普通话水平,应试者的错误率极高,严重影响普通话测试目标的实现。本文根据汉语言文字的特点,提出改变试题的形式,以期真正实现测试目标。  相似文献   

14.
以真假字判断任务为研究范式,考查汉字单字识别的正字法加工是否受字频、部件频率、部件数和目标字类型等因素的影响,从而探讨正字法的加工方式。结果表明:字频、部件数和目标字类型对汉字识别的正字法加工存在显著影响;部件频率对汉字正字法识别的影响不显著。结果证实,汉字单字识别的正字法加工存在两种加工方式并存的现象。  相似文献   

15.
为解决图像像素表示汉字特征方法不能有效表示汉字本质特征、空间复杂度较高的问题,提出了一种汉字图特征提取方法。方法主要包含汉字图像二值化,汉字图像骨架提取,汉字图特征提取3个部分;二值化消除图像中的噪声,提高图特征提取的准确度;骨架提取保留图像中重要的像素点,剔除无关的像素点;图特征提取将汉字关键点与图数据结构结合来表示汉字形状特征。在3 908个常用汉字的5种字体上进行实验。结果表明,该方法能够正确提取笔画复杂汉字的图特征,有效表示汉字本质特征;不同字体汉字图特征相同的汉字数量最高为3 195个,方法表现较稳定;平均每个汉字可以用22.6个图节点、19.1个边表示,相较于用单通道图像表示汉字特征,可大幅降低空间复杂度。  相似文献   

16.
吴琴霞 《科学技术与工程》2013,13(15):4426-4432
目前汉字字形的生成仍是手工劳动和人工设计,加上汉字数据量巨大截止到现在没有一种合适的字形自动化生成工具可以使用。针对这一难题提出了一种基于字形描述库的汉字字形自动生成的技术。该技术先将汉字字形与字形描述库映射,以字形描述库为桥梁将汉字字形数据化,然后通过查找字形描述库找到汉字对应的骨架信息,提取笔画骨架。最后通过数据的逆向处理将笔画骨架信息还原为各种汉字字形,形成汉字字形库。  相似文献   

17.
汉字笔画若干数据的统计方法研究与应用   总被引:5,自引:0,他引:5  
统计汉字笔画信息的各种数据,这些数据主要包括:每个汉字的平均笔画数及按使用频度加权的平均笔画数、以各种笔画起笔的汉字数目、各种笔画在汉字字库中的出现次数、汉字字库中笔画相同的汉字、能与其他字区分开的汉字前若干笔画数的平均数与加权平均数以及汉字字库中相邻笔画的频度等。统计的数据对于基于笔画的汉字输入法和汉字的联机手写识别等方面具有重要的指导意义,我们根据这些统计资料设计了标准键盘和数字键盘,并在Windows下实现了以上两种笔画输入法。  相似文献   

18.
一种基于字符轮廓特征的印刷体汉字切分方法   总被引:1,自引:0,他引:1  
针对单一汉字切分方法的不足,提出一种基于字符轮廓凹凸特征的印刷体汉字切分方法,首先对扫描后的印刷体汉字文本图像进行二值化处理,根据整篇汉字字符的左右轮廓凹凸特征,把字符图像切成一个个的汉字行,最后根据每一个汉字行的字符串上下轮廓凹凸特征,把每一个汉字行切分为单独的汉字字符.仿真实验表明,提出的方法对于标准的纯印刷体汉字文本图像,可以得到比较理想的切分效果.  相似文献   

19.
由于收字范围过宽,字形来源过多以及流传时间久远等原因,《康熙字典》所收录的"古文"形体讹混现象很严重。可分为笔划的讹混、偏旁的讹混和整个文字的讹混三类。  相似文献   

20.
将汉字的视觉心理尺度这一连续的、无法用物理量直接分析评价的问题进行离散化,利用模式识别的手法加以研究.根据形状知觉尤其是汉字知觉的心理法则,抽取与汉字视觉心理尺度相关的黑点数、一次心距、二次心距等量张成特征空间.调查事先经专家认定在视觉心理上分属于大、中、小三集团的汉字在该特征空间中分布情况.经实验可知该分布有良好的聚类,证实了该特征集对汉字视觉心理尺度分类的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号