首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 406 毫秒
1.
汉字的层次轮廓特征及其应用   总被引:5,自引:0,他引:5  
汉字特征的描述与匹配,是汉字识别研究中的两个重要问题。从上下左右四个不同的方向看一个汉字,在不同的层次和位置,可以得到不同的曲线段,这些曲线段是汉字笔划的反映,唯一地确定了汉字的结构。基于这一观点,本文从轮廓的角度,给出了汉字特征的一种形式化描述方法,提出了汉字的层次轮廓概念,给出了相应的局部最优匹配算法,最后,将该方法应用于特定人脱机手写体汉字识别中,取得了较为理想的效果。  相似文献   

2.
质心层次特征的无约束手写体数字识别   总被引:5,自引:0,他引:5  
光学字符识别(OCR)是模式识别最为成功的应用之一.目前,OCR的研究重点是无约束手写体字符识别.采用了基于字符质心的层次特征对无约束手写体数字进行分类识别.基于字符质心的不均匀分块方法,在一定程度上可以克服无约束手写体数字字形千变万化所引起的不稳定性.层次特征将字符在空间的二维分布转化为一维,特征抽取过程简单,易于实现.将该算法应用于无约束手写体数字的信函分拣系统,单字的平均识别率达97%以上.  相似文献   

3.
基于组合特征的多分类器集成的脱机手写体彝文字识别   总被引:2,自引:0,他引:2  
组合特征的多分类器集成是提高脱机手写体字符识别率的一种发展趋势,选用2组具有统计特征的组合特征对脱机手写体彝文字进行识别:第1组,使用应用广泛的弹性网格特征、笔划密度特征;第2组,使用方向线素特征和投影特征;同时本文提出一种基于笔划粗切割的特征提取方法用于彝文字的结构特征的提取.最后通过多分类器集成方案输出识别结果.实验结果表明,该方法能得到比较理想的识别效果.  相似文献   

4.
手写体汉字特征提取的研究   总被引:2,自引:0,他引:2  
在手写体汉字识别的研究中,汉字的特征提取可以说是整个手写体汉字识别系统中最重要的一部分。本文针对手写体汉字特点,找到了能充分反应手写体汉字特点的三种特征井加以提取;同时提出了将汉字分解为部件来识别的观点。实验结果表明所提取的特征兼顾了提取方法的方便性和特征的稳定性;这些特征能有效地识别手写体汉字。  相似文献   

5.
文章为研究脱机手写体汉字识别问题,将汉字样本及其特征向量看作是一个信息系统,采用基于β近似依赖度的属性重要度定义作为启发式信息,设计出在变精度粗糙集模型下的特征属性近似约简算法,对手写体汉字信息系统中冗余特征属性进行约简,构建出脱机手写体汉字识别决策信息系统。识别过程中采用基于加权规则置信度的规则融合方法,进一步提高了脱机手写体汉字的可识别性和正确识别率。实验结果表明,该方法是有效可行的。  相似文献   

6.
兼顾连笔和笔顺的联机手写汉字识别方法   总被引:4,自引:0,他引:4  
为解决联机手写汉字识别技术中兼顾连笔和笔顺的难题,提出了联机手写汉字的模糊属性关系图描述和基于知识的松驰匹配方法。该方法能充分描述汉字结构、对手写变形不敏感,并具有良好的连笔字识别能力和适应不同笔顺的特点。基于上述方法,作者实现了一个联机手写汉字识别系统。实验结果表明,本方法能够有效地增加对于低限制书写汉字的识别正确率,并具有较好的抗噪声能力。经过22530汉字测试,首位识别率达98.8%,前十位识别率达99.7%。  相似文献   

7.
通过对汉字整体结构的分析及描述,在传统的特征点基础上,我们双提出了一种新的特征点,并对常用的特征点判别方法进行了改进。这种方法可以应用于印刷汉字及允许一定变形的手写体汉字,经实验表明,提取精度较高。  相似文献   

8.
RBF-DDA 神经网络用于手写体汉字识别的研究   总被引:2,自引:0,他引:2  
使用了一种新的神经网络模型———动态衰减调节径向基函数(RBFDDA),并结合一种新的特征提取方法来进行手写体汉字识别的研究,通过对100种汉字、15000个样本的初步实验,取得了识别率为99%的良好结果,表明将RBFDDA引入到手写体汉字识别的研究是比较成功和可行的。  相似文献   

9.
文章研究了一种基于过程神经网络的脱机手写体汉字特征提取方法。采用描述汉字整体构架性和可拆分性的笔划类型、笔划位置、笔划顺序以及拓扑结构特征的融合,给出了一种脱机手写体汉字特征表征方法以及冗余容错表征形状。采用过程神经网络模型的横向时间累积和纵向空间加权求和方法,模拟手写体汉字从左到右和从上到下的书写过程,给出了提取脱机手写体汉字特征的算法与步骤。采用粒子群优化学习算法保证过程神经网络的全局学习能力和收敛能力,建立了手写体汉字特征知识数据结构表,对SCUT-IRAC中的手写体汉字特征提取进等了仿真实验,结果表明该方法具有良好的“认知”手写体汉字特征的能力。  相似文献   

10.
文章提出了近年来常用的几种脱机手写体藏文的特征提取方法,其中,比较有代表性的、识别率较高的是基于轮廓跟踪的笔划提取方法、基于模糊方向线素的特征提取方法,文中将主要对这两种方法进行介绍,同时简要的介绍了另两种较有发展前途的方法.  相似文献   

11.
在对计算机的汉字识别方法讨论分析之后,本文以汉字的结构特征为基础,提出了一个新的笔划跟踪搜索方法,用来解决手写体汉字的识别问铱,在该方案中采取了速度快、质量好的平滑细化等预处理方法。在特征抽取中采用了定向记忆跟踪和笔划拼接二种方法,从而解决了在笔划抽取中,特别是在笔划经过细化处理后,不可避免地带来某种程度的笔划畸变的情况下,如何正确地抽取笔划特征,找到了一个较完善的处理方法。经过大量的计算机实验,证明该方法切实可行。且已使正确识别率提高到95%以上,误认率低于5%,识别速度小于2秒。  相似文献   

12.
特征抽取是识别中的重要步骤,提取描述性强的特征能够有效提高分类器的识别效率。在提出有关概念的基础上,介绍了特征行抽取在字符过程中的两个重要应用。首先,在分类识别时可用作匹配的特征向量,通过双向匹配来识别独立的字符。其次,可在识别粘连字符时用于预测前端字符,并在提取前端字符后对预测结果进行验证,从而达到准确分割和识别粘连字符的目的。还详细描述了交互确定特征行的方法。最后根据实验数据对字符特征行的应用价值作出了评价。  相似文献   

13.
在大样本测试集下国内现有成熟的OCR识别软件的首位识别准确率为95%~97%之间,在准确率和方法上仍有提升和改进的空间。提出一种基于概率特征和结构特征融合的自适应文字识别算法,模拟人类学习的模式,通过对训练样本的不断学习去构建汉字在测量空间的概率分布矩阵,然后比对原始图像和标准汉字库中汉字的概率分布矩阵的相似度来达到汉字分类的效果。其中相似度度量准则是从矩阵空间的结构和概率2个角度出发去构建的,充分考虑了结构模式识别和统计模式识别的优缺点。实验结果显示算法在训练样本下的首位识别正确率可以达到99.66%,在1 623张非训练样本文字图像下的首位识别正确率可以达到99.13%,在5 515张非训练样本文字图像下的首位识别正确率可以达到98.57%。可以证明提出的相似度度量方法在文字识别中的有效性。  相似文献   

14.
利用计算机进行字符自动识别与录入的技术对机器翻译、数据挖掘、人工智能等都有着重要的理论意义和实用价值,基于数字图像处理技术的字符识别是其中的一个重要发展方向。文章重点研究了字符特征提取和匹配识别这两个影响字符识别效果的因素,根据中文字符笔画的方向特点,选择了对图像方向特征敏感的Gabor变换作为特征提取方式,在获取字符的特征向量后,先利用最小距离分类器进行预分类,再利用最小距离分类中产生的候选样本集训练SVM分类器,识别时只需利用候选集分类器依次判决,降低了训练和识别工作量,同时提高了识别效率。实验表明,系统对网站导航字符平均识别率达94%以上,具有一定的理论意义和实用价值。  相似文献   

15.
现有的光学印刷体汉字识别(OPCCR)系统中,汉字识别率虽然已经高达98%以上,但仍然会发生错误识别的情况.通常,这些错误的识别还不能被自动检测,采用人工检测,费时费力,大大降低了实际应用系统的自动化和智能化程度.为此,本论文提出了基于网格笔划密度特征的OPCCR错误的自动检测算法.本算法首先建立标准汉字的网格笔划密度特征的特征库.然后,在OPCCR错误的自动检测时,对光学印刷体汉字图像进行预处理、行分割、列分割得到单个汉字图像,提取单个汉字图像的网格笔划密度特征.再把特征和相应的识别出的汉字的特征库中的特征进行相关匹配.于是,根据特征匹配自动检测OPCCR的错误.  相似文献   

16.
为解决机械故障小样本模式识别问题,有效地提高分类的准确率,提出了一种基于经验模式分解模糊特征提取的支持向量机混合诊断模型.该模型通过对信号进行经验模式分解,提取信号的本征模式分量并转化为模糊特征向量,对机器故障进行诊断,然后将模糊特征向量输入到多分类的支持向量机中,实现了对机器不同故障类型的识别.将该模型应用于汽轮发电机组的3种工作状态的识别中,测试结果表明,同原有的未经过任何特征提取以及经过小波包模糊特征提取的2种多分类支持向量机方法相比,该模型将分类准确率从原有的53.33%和86.67%提高到100%,有效地改善了分类的准确性.同时,该模型还为汽轮发电机组的故障确诊提供了有力依据.  相似文献   

17.
针对古籍文献版面图像切分中存在的过切分和粘连等问题,提出基于犹豫模糊集的古籍汉字图像切分方法。首先,对古籍汉字版面图像进行连通区域搜索,获取版面中的笔画部件,实现古籍汉字的初切分;然后,对过切分汉字进行特征分析,提取过切分区域的特征,利用犹豫模糊集在处理多属性决策问题方面的优势,通过建立犹豫模糊集来判断过切分区域归属同一古籍汉字的隶属度,并据此进行过切分区域的合并;最后,对存在粘连和重叠的汉字采用分段像素跳跃数突变分析方法进行分割。在28 886个古籍汉字上的实验结果显示,可以达到92. 3%的切分准确率和85. 7%的过切分合并准确率。  相似文献   

18.
提出了一种改进模板匹配的车牌字符识别方法。详细介绍了车牌字符识别的过程,主要包括模板的建立,基于弹性网格的字符特征提取,模板匹配的步骤及改进方法。运用该方法不仅可减少计算量,而且提高了实时性。实验结果表明,提出的方法具有效率高、精确度好等特点,识别率可以达到90%以上。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号