首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 94 毫秒
1.
一种改进的手写汉字文本切分算法   总被引:9,自引:1,他引:8  
  相似文献   

2.
面向字形分析的联机手写汉字笔画识别   总被引:1,自引:0,他引:1  
介绍了一种面向字形分析的联机手写输入汉字的笔画识别方法,并给出实现算法.该方法首先找出笔画的关键点,然后将笔画分割为小笔画段,再将其合并为较大的笔画段.实验表明,处理后的笔画成为类型确定的笔画段或笔画段的组合,易于规整化为内部模型.  相似文献   

3.
基于基本笔画笔压特征的手写汉字笔迹鉴定的研究   总被引:4,自引:1,他引:3  
基于汉字笔迹鉴定的有效特征主要蕴含于基本笔画运笔中的设想,提出以手写汉字基本笔画为研究对象,抽取其中笔压变化特征,形成特征空间,求得鉴定对象在特征空间中分布,并计算它与辞书中各书写者之间的广义距离,从而实现笔迹的鉴定.本研究选用10位书写者,四种基本笔画,每种基本笔画采用10个样本进行了实验.其结果证实了本方法完全克服了以往笔迹鉴定研究中结体依存性带来的不足,只需对少数基本笔画的研究就对全体汉字有效,大大缩小了辞书空间.  相似文献   

4.
介绍了矢量曲线数据压缩算法-Douglas-Peucker算法,使用Visual C++编程实现了按笔画联机手写汉字的笔画信息的获取,并应用Douglas-Peucker算法解决了联机手写汉字笔画关键点的提取.  相似文献   

5.
现有计算机在指导手写汉字练习与测试中,指导依据大都基于全局特征,缺少基于更细粒度特征。提出一种基于局部信息的手写汉字笔画提取方法,为手写汉字评价与指导等任务提供数据支持。首先提取出汉字骨架并对骨架中的毛刺与断裂等问题进行优化;然后使用PBOD算法提取汉字交叉区域后,对交叉区域进行合并删除,消除笔画形变,通过局部信息计算笔画段的组合系数,根据组合系数提取笔画;最后根据获取到的笔画数与算法迭代次数,动态调整组合系数阈值,保证在正确连接笔画段的前提下提取到更可能多的笔画。将该方法在手写汉字数据集上进行实验,其准确率、召回率与F1值分别达到了95.91%、95.71%与95.81%,可用于后续的手写汉字评判与指导等任务。  相似文献   

6.
基于识别的粘连手写数字串切分系统   总被引:3,自引:0,他引:3  
为解决手写数字串中的粘连问题,提出了一种基于识别的粘连手写数字串切分系统。该系统通过外轮廓分析和投影分析,找出相应的候选切分线。利用候选切分线对数字串过切分,过切分后的每个子图像定义为一个片段,相邻的一个或多个片段的组合定义为一个集团。数字串的每个候选切分结果由一个或多个集团组成。对所有的候选切分结果建立一个概率模型,并使用单个数字识别器对所有集团进行识别。根据最大后验概率准则,选出最优的切分结果。在搜索最优切分结果时,使用剪枝算法,降低了算法的时间和空间复杂度,从而满足实时处理要求。利用从NISTSD19中收集到的样本进行实验,正确切分率高达97.72%。  相似文献   

7.
对自然手写体汉字联机识别系统中笔画和字根提取问题作了深入研究,提出并改进了有关策略和算法实现。经深入分析和测试结果表明,由于充分考虑了自然手写体汉字的书写习惯和结构特征,技术策略和算法实现具有高稳定性和变形容忍度。  相似文献   

8.
在分析传统手写汉字文本切分算法利弊的基础上 ,提出了一种改进的基于快速连通域提取的切分算法 ,算法具有很强的抗干扰能力 ,有效解决了小角度歪斜图像和笔画粘连字符的汉字切分问题 .同时给出了具体的实现方法  相似文献   

9.
基于笔划合并和动态规划的联机汉字切分算法   总被引:4,自引:0,他引:4  
联机手写汉字识别已从单字识别走向多字,乃至整篇文档的识别,字符的正确切分很大程度上决定了系统的性能.为了提高系统对整页文档的切分识别性能,该文提出了一种联机手写汉字的切分算法.通过基于规则的笔划合并将单个笔划合并成字符块,在此基础上,采用动态规划算法,利用字符块的长宽比、大小、间距以及识别信息,寻找出最优的切分路径.同时,对于手写汉字的任意性,提出了一种对汉字外接矩形框进行裁减的调整算法,使外接框并不包含整个汉字.实验证明,该文所提出的算法对于字数较多的多行样本以及存在字符相互粘连的情况,都有着很好的效果.  相似文献   

10.
为了实现智能化汉字书写教学,提出一种手写汉字图像的笔画还原方法。首先提取手写汉字图像的骨架;然后从知识工程的角度出发,利用字形中稳定的拓扑信息,消除骨架中的歧义变形;最后利用A*算法建立并求解手写汉字与相应模板汉字的字形相似度模型,从而分割出手写汉字图像中的各个笔画,并输出它们与模板汉字中各个笔画的对应关系。此方法的笔画还原结果可以应用于手写汉字规范性的自动化评判等场合。  相似文献   

11.
非限定手写汉字的分割研究   总被引:2,自引:0,他引:2  
分析目前手写汉字分割研究的几种有效方法,在此基础之上提出了针对非限定手写汉字分割的多层投影算法。通过对经典投影方法的补充和扩展,建立算法的基本模型,编写相应的程序,应用于支票校验系统当中。实际的金融支票大写汉字识别实验结果证实所提出的算法的有效性。  相似文献   

12.
一种基于字符轮廓特征的印刷体汉字切分方法   总被引:1,自引:0,他引:1  
针对单一汉字切分方法的不足,提出一种基于字符轮廓凹凸特征的印刷体汉字切分方法,首先对扫描后的印刷体汉字文本图像进行二值化处理,根据整篇汉字字符的左右轮廓凹凸特征,把字符图像切成一个个的汉字行,最后根据每一个汉字行的字符串上下轮廓凹凸特征,把每一个汉字行切分为单独的汉字字符.仿真实验表明,提出的方法对于标准的纯印刷体汉字文本图像,可以得到比较理想的切分效果.  相似文献   

13.
手写体信函地址汉字切分   总被引:3,自引:0,他引:3  
目前多数汉字识别系统仍基于单个汉字的逐个识别,因此对字符进行有效的切分,是离线汉字识别的一项重要工作,根据汉字手段写体的特点,在方差最小原理基础下,提出多步切分算法(粗分-细分-合并)和穿越算法,首先根据字段间间隔,用最小距离聚类的方法,得到5组粗分结果,从中选出最接近理想的一种,用改变类间距离和穿越算法,对较宽的字段进行细分,最后将过细的分割部件合并成一个完整的字,对现场采集的3000封信函进行切分,单字正确率可达90.8%。  相似文献   

14.
基于笔划方向特征和非对称分布的手写体汉字识别模型,提出一种从手写体汉字骨骼图像上提取分叉点的有效改进算法,保证笔划提取的可靠性,并直接从笔划结构上计算统计识别特征矢量;采用主向量空间的非对称参数分布模型计算距离测度.实验表明,基于笔划方向特征和非对称分布的统计识别模型具有优良的识别性能.  相似文献   

15.
构建一个提供评测工具的笔画基准测试库, 其中包含一个人工搭建的笔画数据库, 该数据库拥有4种字体的汉字图像以及对应的人工提取的笔画信息。通过比较算法自动提取的笔画结果和数据库中的标准笔画之间的差异, 测试库可以评测笔画自动提取算法的性能。还提出一种新的基于Delaunay三角剖分的方法, 可以有效地从汉字图像中提取出笔画信息。在测试库中对现有的3 种笔画提取方法进行比较, 实验数据表明, 所提出的笔画基准测试库能够对笔画提取算法给出有效的评测, 并且新的算法在汉字笔画提取的性能中效率较高。  相似文献   

16.
该文给出一种汉字子笔划的提取方法 ,较好地解决了因子笔划相交 ,使提取的同类字符子笔划不稳定问题。引入了字符的固定部件划分方法及特征矩阵的概念。字符部件中包含各类子笔划的位置、长度等信息 ,特征矩阵是这些信息的集中体现。设计了一种新的遗传算法 ,由未知字符一个部件的一类子笔划表示的字符与某类模型的相似度 ,既由与其它 3类子笔划相应的相似度调节 ,又由与周围部件同类子笔划相应的相似度调节。实验表明 ,该手写体汉字识别方法是有效的  相似文献   

17.
基于组合特征的多分类器集成的脱机手写体彝文字识别   总被引:2,自引:0,他引:2  
组合特征的多分类器集成是提高脱机手写体字符识别率的一种发展趋势,选用2组具有统计特征的组合特征对脱机手写体彝文字进行识别:第1组,使用应用广泛的弹性网格特征、笔划密度特征;第2组,使用方向线素特征和投影特征;同时本文提出一种基于笔划粗切割的特征提取方法用于彝文字的结构特征的提取.最后通过多分类器集成方案输出识别结果.实验结果表明,该方法能得到比较理想的识别效果.  相似文献   

18.
数千年来 ,汉字在约定俗成和不断规范中形成了自己的体制原则。它在周边民族和国家的使用与传播中 ,由于不同的文化背景 ,发生了种种变异 ,经历了五种形态 :汉字汉文→汉字某 (民族 )文→某族汉字→自创民族文字→新“书同文”和大字符集建设 ,并因而形成了汉字系文字以及使用汉字系文字的国际区域。汉字的这种变异与地理、历史、儒学、宗教、民族等东方文化背景有关 ,并呈现出层次性、离合性、互动性和宽容性等特征  相似文献   

19.
一种联机手写汉字识别算法的研究与实现   总被引:1,自引:0,他引:1  
联机手写汉字识别(On-line handwritten Chinese character recognition,简称OLCCR),是指用笔在图形输入板上写字,人一面写,机器一面认,是一种方便的汉字识别手段,是在各种自动识别输入的方法中,能够代替或部分代替人工编码输入的惟一可能的方法。设计了一种基于获取笔段序列的联机手写汉字识别方法,并用可视化编程工具VC++6.0实现了该算法,经测试,平均识别率达95.7%。  相似文献   

20.
提出一种基于笔画的汉字编码输入法,将汉字的所有笔画按特征分为8类,以简单的规则形成汉字的简易编码,易学易记;在此基础上增加少量几个高频部件形成高效编码,大大地降低了重码率;同时提出容错编码,使有错误笔顺习惯的人都能正确输入汉字;最后,对实现过程中的有关问题进行讨论.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号