首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
在实现结构分析法识别手写汉字时,笔划抽取是关键所在。本文提出了一种直接从手写汉字点阵中抽取笔划特征的新算法。该算法具有算法简单、笔划抽取速度快、正确率高和抗干扰能力强的特点。这种算法已用于在PC/AT机上实现的成页手写体汉字(楷体)识别系统中,效果极为满意。  相似文献   

2.
基于笔划方向特征和非对称分布的手写体汉字识别模型,提出一种从手写体汉字骨骼图像上提取分叉点的有效改进算法,保证笔划提取的可靠性,并直接从笔划结构上计算统计识别特征矢量;采用主向量空间的非对称参数分布模型计算距离测度.实验表明,基于笔划方向特征和非对称分布的统计识别模型具有优良的识别性能.  相似文献   

3.
基于数学形态学的图像汉字笔划细化和提取   总被引:1,自引:0,他引:1  
文章提出了一种基于数学形态学的图像汉字笔划细化和提取方法。根据汉字的结构特点,定义了一组新的结构元素序列,保持了原样本图像汉字的连通性和拓扑性的骨架,有效地抑制样本细化后汉字笔划的扭曲和歪斜;在此细化的结果基础上,定义了一种新的汉字笔划提取算法,准确提取出原汉字的横竖撇捺笔划的形状、形态及形式结构信息,取得了理想的效果。  相似文献   

4.
汉字的层次轮廓特征及其应用   总被引:5,自引:0,他引:5  
汉字特征的描述与匹配,是汉字识别研究中的两个重要问题。从上下左右四个不同的方向看一个汉字,在不同的层次和位置,可以得到不同的曲线段,这些曲线段是汉字笔划的反映,唯一地确定了汉字的结构。基于这一观点,本文从轮廓的角度,给出了汉字特征的一种形式化描述方法,提出了汉字的层次轮廓概念,给出了相应的局部最优匹配算法,最后,将该方法应用于特定人脱机手写体汉字识别中,取得了较为理想的效果。  相似文献   

5.
一种用边界细化汉字的方法   总被引:2,自引:0,他引:2  
汉字骨架是汉字的一种重要几何特征,如何对汉字进行细化,是对汉字进行识别的前提。在此提出了一种新的细化汉字方法,它是通过笔划的边缘求出其中心,以笔划中心作为细化结果。实验证明该方法具有较好的细化结果。  相似文献   

6.
在对计算机的汉字识别方法讨论分析之后,本文以汉字的结构特征为基础,提出了一个新的笔划跟踪搜索方法,用来解决手写体汉字的识别问铱,在该方案中采取了速度快、质量好的平滑细化等预处理方法。在特征抽取中采用了定向记忆跟踪和笔划拼接二种方法,从而解决了在笔划抽取中,特别是在笔划经过细化处理后,不可避免地带来某种程度的笔划畸变的情况下,如何正确地抽取笔划特征,找到了一个较完善的处理方法。经过大量的计算机实验,证明该方法切实可行。且已使正确识别率提高到95%以上,误认率低于5%,识别速度小于2秒。  相似文献   

7.
提出了一种基于游程编码(run length encoding)的手写体汉字细化和分割快速算法。数据的输入与处理并行,汉字图象数据所占存贮空间仅为点阵方式的1/400。能将任何复杂汉字细化并分割为简单直线和弧线笔划。对汉字的结构特征抽取极为有利。此外,本文还提出一种新的边沿描述基段链码,其平均长度比Freeman链码短20%。  相似文献   

8.
基于笔划合并和动态规划的联机汉字切分算法   总被引:4,自引:0,他引:4  
联机手写汉字识别已从单字识别走向多字,乃至整篇文档的识别,字符的正确切分很大程度上决定了系统的性能.为了提高系统对整页文档的切分识别性能,该文提出了一种联机手写汉字的切分算法.通过基于规则的笔划合并将单个笔划合并成字符块,在此基础上,采用动态规划算法,利用字符块的长宽比、大小、间距以及识别信息,寻找出最优的切分路径.同时,对于手写汉字的任意性,提出了一种对汉字外接矩形框进行裁减的调整算法,使外接框并不包含整个汉字.实验证明,该文所提出的算法对于字数较多的多行样本以及存在字符相互粘连的情况,都有着很好的效果.  相似文献   

9.
基于笔划合并的手写体信函地址汉字切分识别   总被引:6,自引:1,他引:6  
为了自动地处理存在着大量的笔划交叉与粘连的实际信函地址行,采用了一种基于笔划提取合并的手写体汉字切分识别方法.对于从实际信函中提取出的单行地址文本图像,首先提取出字符的横、竖、撇、捺等笔划,再根据一定的准则将笔划合并成字根,最终应用与地址解释相结合的动态规划算法得到最终的切分结果,获得投递区域.用从邮政分拣机上获得的443个信函地址行二值图像样本进行测试,省市一级和市县一级投递地址的正确识别率已经达到了66%.  相似文献   

10.
联机手写体汉字识别中的笔划分类及笔划识别   总被引:9,自引:4,他引:5  
提出了手写体汉字识别的一种毛划分类方法,它把构成汉字系统的笔划分为7种基本单元,并论证了它在整字识别上容忍笔划变形度大的原因。  相似文献   

11.
12.
字向量表示质量对中文文本处理方法有重要影响。目前,常用中文字向量表示方法Word2Vec、GloVe在很多任务中表现优异,但存在向量质量依赖训练数据集、稳定性差、没有考虑汉字整体字形结构所隐含的语义信息、没有利用字典包含的语言知识等问题。为了克服现有方法的不足,该文首先采用字形自编码器自动捕获汉字字形蕴含的语义,再利用字义自编码器抽取字典包含的稳定字义信息,提出了融合中文字形和字义的字向量的表示方法(Glyph and Meaning to Vector)。结果表明,GnM2Vec在近邻字计算、中文命名实体识别和中文分词三项任务中均取得了较好的结果,在命名实体识别中,F1值较GloVe、word2vec、G2Vec(基于字形向量)分别提高了2.25、0.05、0.3;在中文分词中,F1值分别提高了0.3、0.14、0.33,提高了字向量稳定性。  相似文献   

13.
CH-DOS is a Chinese-English compatible information processing system for microcomputers of IBM PC family and GW 0520 family. Assimilating the virtrues Chinese character information processing system prevailing in China, it has achieved many better results.This paper introduces the intention of design and Chinese character inlernal code design, offers the population structure of the system and deals with its realizating process including the reformation of the kernel file, the extension of BIOS and the distributed Spaces of character library and phrase library.  相似文献   

14.
介绍在西环境下显示汉字中信息及制作小型汉字库的原理及方法,同时给出了该方法的实现过程,并利用C语言对主要过程算法作描述,相关程序均在Turbo C(ver2.0)集成开发环境下编译通过。该实现方法无需中环境支持,因此可以为用户节约资源,提高系统的运行速度和资源利用效率。  相似文献   

15.
为实现按部件快速检索汉字,把汉字递归表示为汉字结构、字首部件和字尾部件三元组。以部件为运算对象,字型结构为运算符,将汉字描述为前缀表达式。提出汉字表达式的双链表存储模型,设计双链表生成算法及基于双链表存储的检索方法。与直接采用数组存储相比,使用双链表存储时检索的平均比较次数仅为数组存储的50%,并易于动态提升检索性能。  相似文献   

16.
本文通过对NZK一I型汉字产生器接口技术的剖析,说明把汉字库设计成一种智能的I/O设备,可与主机一起构成多CPU系统.这种结构对于绝大多数的微型计算机系统的汉字信息处理是一种行之有效的办法.  相似文献   

17.
提出并实现了一种基于ARM(LPC2148)和TFT液晶模块的UCDOS汉字库加载及字模调用显示的方法。分析了如何把通过字模提取软件获得的点阵代码转换成TFT液晶屏幕的像素显示的方法。针对自带字库的液晶模块(TFT-LCD基本不自带)价格较贵的特点,给出了在ARM中加载汉字库的过程以及如何调用库中的字模代码驱动TFT液晶模块。实验表明,该方法切实可行,对基于ARM的嵌入式系统人机界面的开发也具有一定的参考价值。  相似文献   

18.
民族性格是一个民族共同的精神结构和行为方式。中华民族在几千年的发展过程中形成了其独特的民族性格,但是这种性格特征的形成却受上古神话影响颇深,可以说,上古神话是中华民族性格形成的内在基因,时过千年却割不断两者之间延续、发展的关系。  相似文献   

19.
汉字是表义文字,从汉字的体制看,汉字有语素字和非语素字,从汉字的字音看,汉字不光有单音字,还有许多多音字,从汉字的形体看,汉字是由笔画构成的,有不少汉字的形体相近或相似,构成了形近字。这些语素字、非语素字、多音字和形近字出现在普通话水平测试(PSC)的单字试题中,用来检测应试者的普通话水平,应试者的错误率极高,严重影响普通话测试目标的实现。本文根据汉语言文字的特点,提出改变试题的形式,以期真正实现测试目标。  相似文献   

20.
汉四码汉字输入法的编码方法   总被引:1,自引:0,他引:1  
介绍一种新的音形结合汉字输入法——汉四码的编码方法.其设计思想是根据《现代汉语词典》、《四角号码词典》的检字规则,依据汉字中14种笔形的谐音和字典检字表中部首的首音,编制了汉四码的笔形码元、字根码元对照表,绘制了字根键盘分布图。并根据汉字的结构和笔顺设计了字和词的编码方案.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号