首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 187 毫秒
1.
一种用边界细化汉字的方法   总被引:2,自引:0,他引:2  
汉字骨架是汉字的一种重要几何特征,如何对汉字进行细化,是对汉字进行识别的前提。在此提出了一种新的细化汉字方法,它是通过笔划的边缘求出其中心,以笔划中心作为细化结果。实验证明该方法具有较好的细化结果。  相似文献   

2.
基于笔划合并的手写体信函地址汉字切分识别   总被引:6,自引:1,他引:6  
为了自动地处理存在着大量的笔划交叉与粘连的实际信函地址行,采用了一种基于笔划提取合并的手写体汉字切分识别方法.对于从实际信函中提取出的单行地址文本图像,首先提取出字符的横、竖、撇、捺等笔划,再根据一定的准则将笔划合并成字根,最终应用与地址解释相结合的动态规划算法得到最终的切分结果,获得投递区域.用从邮政分拣机上获得的443个信函地址行二值图像样本进行测试,省市一级和市县一级投递地址的正确识别率已经达到了66%.  相似文献   

3.
基于笔划的手写体汉字方向分解特征提取方法   总被引:5,自引:1,他引:5  
提出了一种基于笔划的手写体汉字方向分解特征提取的新方法。根据每个笔划像素点及其邻域像素点的方向分布特征,汉字图像被分解为“横”、“竖”、“撇”和“捺”4种子模式,而无需提取轮廓和骨架。文中构造了5种不同的弹性网络,并将其应用于方向分解特征的提取,最后,应用863手写样本库HCL2000验证了本文方法的有效性。  相似文献   

4.
基于笔划方向特征和非对称分布的手写体汉字识别模型,提出一种从手写体汉字骨骼图像上提取分叉点的有效改进算法,保证笔划提取的可靠性,并直接从笔划结构上计算统计识别特征矢量;采用主向量空间的非对称参数分布模型计算距离测度.实验表明,基于笔划方向特征和非对称分布的统计识别模型具有优良的识别性能.  相似文献   

5.
在对计算机的汉字识别方法讨论分析之后,本文以汉字的结构特征为基础,提出了一个新的笔划跟踪搜索方法,用来解决手写体汉字的识别问铱,在该方案中采取了速度快、质量好的平滑细化等预处理方法。在特征抽取中采用了定向记忆跟踪和笔划拼接二种方法,从而解决了在笔划抽取中,特别是在笔划经过细化处理后,不可避免地带来某种程度的笔划畸变的情况下,如何正确地抽取笔划特征,找到了一个较完善的处理方法。经过大量的计算机实验,证明该方法切实可行。且已使正确识别率提高到95%以上,误认率低于5%,识别速度小于2秒。  相似文献   

6.
本文提出一种手写印刷体汉字识别方法,使用该方法无需先对汉字进行细化和平滑处理。利用汉字笔划的相关性,抽取汉字图像的结构特征.在特征抽取过程中,考虑到一些噪声的影响,因而对质量较低劣的汉字识别也有效。实验结果较满意。  相似文献   

7.
提出了一种基于游程编码(run length encoding)的手写体汉字细化和分割快速算法。数据的输入与处理并行,汉字图象数据所占存贮空间仅为点阵方式的1/400。能将任何复杂汉字细化并分割为简单直线和弧线笔划。对汉字的结构特征抽取极为有利。此外,本文还提出一种新的边沿描述基段链码,其平均长度比Freeman链码短20%。  相似文献   

8.
基于笔划和笔顺的汉字识别算法   总被引:4,自引:0,他引:4  
以笔划为基元结构笔划的顺序来表示汉字的结构信息,在此基础上提出了一种笔写汉字识虽的匹配算法,对于结构类似的汉字,该算法可以通过特征关系予以识别,从而提高汉字的识别率。  相似文献   

9.
该文给出一种汉字子笔划的提取方法 ,较好地解决了因子笔划相交 ,使提取的同类字符子笔划不稳定问题。引入了字符的固定部件划分方法及特征矩阵的概念。字符部件中包含各类子笔划的位置、长度等信息 ,特征矩阵是这些信息的集中体现。设计了一种新的遗传算法 ,由未知字符一个部件的一类子笔划表示的字符与某类模型的相似度 ,既由与其它 3类子笔划相应的相似度调节 ,又由与周围部件同类子笔划相应的相似度调节。实验表明 ,该手写体汉字识别方法是有效的  相似文献   

10.
基于笔画分析和背景细化的粘连手写汉字切分   总被引:5,自引:0,他引:5  
离线手写汉字的切分是识别的前提,其中粘连手写汉字的切分最为困难。提出一种基于笔画分析和背景细化的粘连手写汉字的切分新方法。对粘连字符图像作细化处理,检测端点、叉点和角点等特征点,根据特征点提取笔段。按笔段的长度、相互之间的位置关系以及投影信息确定切分点。细化粘连字符的背景图像,从切分点出发在细化的背景中选取分割路径,实现粘连手写汉字的切分。实验表明,本方法对于粘连手写汉字具有令人满意的切分效果。  相似文献   

11.
构建一个提供评测工具的笔画基准测试库, 其中包含一个人工搭建的笔画数据库, 该数据库拥有4种字体的汉字图像以及对应的人工提取的笔画信息。通过比较算法自动提取的笔画结果和数据库中的标准笔画之间的差异, 测试库可以评测笔画自动提取算法的性能。还提出一种新的基于Delaunay三角剖分的方法, 可以有效地从汉字图像中提取出笔画信息。在测试库中对现有的3 种笔画提取方法进行比较, 实验数据表明, 所提出的笔画基准测试库能够对笔画提取算法给出有效的评测, 并且新的算法在汉字笔画提取的性能中效率较高。  相似文献   

12.
本文提出一种对限制性手写汉字的结构识别方法。在对汉字的笔画构成以及笔画之间的相互关系进行分析的基础上,采用链码来描述汉字的结构特点。通过回溯策略的运用,使得笔画抽取中的一些错误可以得到自动的纠正。在实验中,该方法对500字种的常用汉字取得了较好的识别结果。  相似文献   

13.
汉字笔画若干数据的统计方法研究与应用   总被引:5,自引:0,他引:5  
统计汉字笔画信息的各种数据,这些数据主要包括:每个汉字的平均笔画数及按使用频度加权的平均笔画数、以各种笔画起笔的汉字数目、各种笔画在汉字字库中的出现次数、汉字字库中笔画相同的汉字、能与其他字区分开的汉字前若干笔画数的平均数与加权平均数以及汉字字库中相邻笔画的频度等。统计的数据对于基于笔画的汉字输入法和汉字的联机手写识别等方面具有重要的指导意义,我们根据这些统计资料设计了标准键盘和数字键盘,并在Windows下实现了以上两种笔画输入法。  相似文献   

14.
本文从手写印刷体汉字的计算机光学输入的离散模式出发,提出一种称为S-E坐标的特征提取的新方法。S-E坐标的特征提取及基于S-E坐标的汉字骨架重构在快速实时、数据压缩、畸变消减以及抗干抗性等方面优于通常的细化算法。最后简介基于S-E坐标的汉字识别法。分析与实验表明,S-E坐标为进一步的特征提取和汉字识别提供了一种有效的工具。  相似文献   

15.
基于基本笔画运笔特征的汉字笔迹鉴定的研究   总被引:2,自引:2,他引:0  
基于汉字笔迹鉴定的有效特征主要蕴于手写汉字笔画运笔中的设想 ,提出以汉字笔画作为笔迹鉴定的主要对象 .在选用手书基本笔画为研究对象的基础上 ,进一步从手书汉字中抽取基本笔画作为对象 ,在基本笔画中抽取反映各自行笔部运笔的特征 ,形成多维特征空间 .求得各鉴定对象在特征空间中的分布 ,计算它与辞书中各书写者位置间的广义距离 ,实现笔迹的鉴定 .实验选用 10位书写者 ,8种基本笔画 ,每种笔画采用 10个样本 ,结果显示对于单一笔画和简单的汉字取得令人满意的鉴定率 .本研究完全克服了以往笔迹鉴定研究中结体依存性的不足 ,大大缩小了辞书所需的空间 .研究结果不仅证实了该方法的可行性 ,还进一步验证了该方法的实用前景 .  相似文献   

16.
七笔形声输入法是一种形码与音码相结合的汉字输入法。它确立横,竖,撇,点,折,钩,方7种笔形,从它们的组合笔形中筛选出26种作为码元,再挑选26个与形码元有联系的代表字,将各形码元和代表字分别配于26年拉丁字母作为代码,按所给编码规则,每个字至多3个形码和1个音码,该输入法限制性因素少,适应范围广,成本低,重码率低,击键次数少,应用广,用户可在通用机上操作。  相似文献   

17.
为解决汉语自然语言处理任务中未登录词问题,人们经常利用汉字的笔画、偏旁、拼音等细粒度特征提高模型的学习能力.为找出这类特征的最佳组合,通过统计方法研究了汉字的音节、起笔、偏旁、声调、词频、笔画数等特征,提出一种可融合多种汉字特征的跨象限助记符映射模型,即相码模型,该模型可自动实现中文字、词与字母编码间的可逆映射.在字符级模型的文本分类实验中,效果理想.此外,模型生成的编码长度适中,保留了可读特性,可用于特殊场合的文本标注,也能为中文文本提供等量的平行语料数据.可见,相码模型是自然语言处理中一个较好的辅助模型.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号