共查询到20条相似文献,搜索用时 187 毫秒
1.
手写体汉字特征提取的研究 总被引:2,自引:0,他引:2
在手写体汉字识别的研究中,汉字的特征提取可以说是整个手写体汉字识别系统中最重要的一部分。本文针对手写体汉字特点,找到了能充分反应手写体汉字特点的三种特征井加以提取;同时提出了将汉字分解为部件来识别的观点。实验结果表明所提取的特征兼顾了提取方法的方便性和特征的稳定性;这些特征能有效地识别手写体汉字。 相似文献
2.
汉字的层次轮廓特征及其应用 总被引:5,自引:0,他引:5
汉字特征的描述与匹配,是汉字识别研究中的两个重要问题。从上下左右四个不同的方向看一个汉字,在不同的层次和位置,可以得到不同的曲线段,这些曲线段是汉字笔划的反映,唯一地确定了汉字的结构。基于这一观点,本文从轮廓的角度,给出了汉字特征的一种形式化描述方法,提出了汉字的层次轮廓概念,给出了相应的局部最优匹配算法,最后,将该方法应用于特定人脱机手写体汉字识别中,取得了较为理想的效果。 相似文献
3.
手写体汉字识别中基于笔段的松驰匹配算法 总被引:1,自引:0,他引:1
在汉字识别中,基于线性变换的识别模型往往会失效,用轮廓线段来进行松驰匹配.当手写体汉字曲折笔划较多时也很难提取稳定的轮廓特征,而且轮廓提取受笔划写书粗细的影响较大。本文用相容匹配算法来提取汉字的笔段特征,用模板匹配识别出手写体汉字样本。文中给出一个100个汉字的识别结果. 相似文献
4.
5.
提出了一种车牌汉字识别方法.该方法基于统计特征中的投影特征将车牌汉字根据结构特征进行粗分类,对于粗分类结果建立不同的BP神经网络分类器,训练完毕后,以MATLAB为软件平台,利用网络参数对车牌汉字进行分类识别.结果表明,该方法对车牌汉字识别有效,识别率高. 相似文献
6.
提出了一种统计识别算法与结构算法相结合的联机手写汉字识别算法,模糊采集手写汉字与模板的结构对应关系.应用统计算法进行特征匹配识别,实现了与书写笔划顺序无关的快速、高识别率、手写字形限制小的国标两级汉字识别. 相似文献
7.
本文提出了一种用于识别印刷体汉字字体的方法。首先对汉字的字符图像进行小波分解,然后依据汉字的字型特点,在分解的各子图像上提取汉字基本笔画(横、竖、撇、捺)的能量比例特征。最后依据提取的字体特征进行分类识别,分类器采用MQDF分类器。在包含六种常用字体的样本集上进行了测试,结果表明本文提出的算法能够对单字符字体进行有效地识别。 相似文献
8.
文章为研究脱机手写体汉字识别问题,将汉字样本及其特征向量看作是一个信息系统,采用基于β近似依赖度的属性重要度定义作为启发式信息,设计出在变精度粗糙集模型下的特征属性近似约简算法,对手写体汉字信息系统中冗余特征属性进行约简,构建出脱机手写体汉字识别决策信息系统。识别过程中采用基于加权规则置信度的规则融合方法,进一步提高了脱机手写体汉字的可识别性和正确识别率。实验结果表明,该方法是有效可行的。 相似文献
9.
甲骨文计算机识别方法研究 总被引:7,自引:0,他引:7
甲骨文是中国最古老的一种象形文字,富有绘画的特点,因此不能用目前识别汉字的方法进行识别。该文提出一种两级分类的识别程序设计方法:首先,将街识字符抽象为一种图,并其拓扑特征进行了第一级识别;然后,给出一种广义笔划定义,并在此基础上提取有关的特征进行第二级识别。初步实验表明,识别率达94%。 相似文献
10.
字符识别在车牌识别中的应用 总被引:7,自引:0,他引:7
介绍了一种识别车牌中汉字字符的方法,它包含了车牌的定位,预处理,字符识别等几个重要环节.该识别方法分为2级,粗分类是依据文字的四周面积编码来分类的;单个汉字的识别,是依据文字的全局笔划方向特征来识别的,由于此识别方法简单,识别速度较快,故识别效果理想, 相似文献
11.
本文提出了一种新的描述多种印刷体汉字的方法——特征链码法.使用该方法无需先对汉字图像进行细化和平滑处理,可以克服汉字图像位移、不同大小以及一些噪声的影响.实验中针对常用的一级字库约3700个仿宋体、宋体、黑体(理论上还可以扩充到二级字库6700多个印刷体汉字,字体还可以增加楷体等),以及相应的尺寸出现的变化如24×24、24×48、48×48等做了特征抽取和识别试验,实验中还对链码特征库进行了几种预分类. 相似文献
12.
印刷体蒙古文字识别技术中切分方法的设计与实现 总被引:1,自引:2,他引:1
文字识别是人工智能的一个重要研究领域.有些民族文字识别的成果已转化为商品化软件.蒙文文字识别的研究还处于起步阶段,蒙古文字的结构和书写方式与其他文种相比有许多特点.印刷体蒙文文字识别技术中字元切分的方法,经过实验其切分正确率在98%以上,并已成功地用于印刷体蒙文识别软件中. 相似文献
13.
在大样本测试集下国内现有成熟的OCR识别软件的首位识别准确率为95%~97%之间,在准确率和方法上仍有提升和改进的空间。提出一种基于概率特征和结构特征融合的自适应文字识别算法,模拟人类学习的模式,通过对训练样本的不断学习去构建汉字在测量空间的概率分布矩阵,然后比对原始图像和标准汉字库中汉字的概率分布矩阵的相似度来达到汉字分类的效果。其中相似度度量准则是从矩阵空间的结构和概率2个角度出发去构建的,充分考虑了结构模式识别和统计模式识别的优缺点。实验结果显示算法在训练样本下的首位识别正确率可以达到99.66%,在1 623张非训练样本文字图像下的首位识别正确率可以达到99.13%,在5 515张非训练样本文字图像下的首位识别正确率可以达到98.57%。可以证明提出的相似度度量方法在文字识别中的有效性。 相似文献
14.
针对印刷体维文在连体段切分部分存在过切分和漏切分的现象,结合水平投影法和连通域搜索法实现维文文本的行切分和单词切分;同时针对连体段切分正确率不高的问题,提出一种新的切分方法。首先对字母连体段位于基线上方的部分进行竖直投影来寻找所有可能的切点,然后利用阈值判定法去除误切分。实验证明,该方法提高了印刷体维文的切分正确率,为提高维文识别的正确率打下基础。 相似文献
15.
基于融合特征和LS-SVM的脱机手写体汉字识别 总被引:3,自引:0,他引:3
提出的脱机手写体汉字识别系统主要研究特征提取和分类识别两个模块.特征提取模块主要包括采用基于不变矩和弹性网格技术的串行特征融合方法,所得到的特征向量不仅充分反映了手写体汉字的全局和局部特征,而且具有很强的区分表达能力.分类识别模块将神经网络多类分类策略与最小二乘支持向量机相结合,所得到的分类器不仅识别率高、泛化能力强,而且有效地解决了多类分类问题.实验证明本文提出的识别系统能够取得很好的识别效果. 相似文献
16.
现有的光学印刷体汉字识别(OPCCR)系统中,汉字识别率虽然已经高达98%以上,但仍然会发生错误识别的情况.通常,这些错误的识别还不能被自动检测,采用人工检测,费时费力,大大降低了实际应用系统的自动化和智能化程度.为此,本论文提出了基于网格笔划密度特征的OPCCR错误的自动检测算法.本算法首先建立标准汉字的网格笔划密度特征的特征库.然后,在OPCCR错误的自动检测时,对光学印刷体汉字图像进行预处理、行分割、列分割得到单个汉字图像,提取单个汉字图像的网格笔划密度特征.再把特征和相应的识别出的汉字的特征库中的特征进行相关匹配.于是,根据特征匹配自动检测OPCCR的错误. 相似文献
17.
印刷体蒙古文文字识别的研究 总被引:5,自引:0,他引:5
分析了蒙文文字的结构特征,论述了蒙文印刷体文字识别的原理,提出了从蒙文文字的预处理到特征提取以及模式分类等各处理阶段的实现方法,并且已将这些方法应用于蒙文印刷体文字识别软件的设计中,试验结果表明这些方法是可行的和高效的。 相似文献
18.
针对汉字的多样性和相似性不同于西方字母,识别相对困难的问题,提出了基于ART神经网络的汉字识别方法.在识别前,利用OpenCV(开源计算机视觉库)将汉字进行图像处理,为后续识别提供输入数据;然后经ART神经网络对输入数据进行训练识别.采用8组相似度较高的汉字作为样本进行实验,证明了方法的有效性. 相似文献
19.
20.
在对计算机的汉字识别方法讨论分析之后,本文以汉字的结构特征为基础,提出了一个新的笔划跟踪搜索方法,用来解决手写体汉字的识别问铱,在该方案中采取了速度快、质量好的平滑细化等预处理方法。在特征抽取中采用了定向记忆跟踪和笔划拼接二种方法,从而解决了在笔划抽取中,特别是在笔划经过细化处理后,不可避免地带来某种程度的笔划畸变的情况下,如何正确地抽取笔划特征,找到了一个较完善的处理方法。经过大量的计算机实验,证明该方法切实可行。且已使正确识别率提高到95%以上,误认率低于5%,识别速度小于2秒。 相似文献