首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
为实现按部件快速检索汉字,把汉字递归表示为汉字结构、字首部件和字尾部件三元组。以部件为运算对象,字型结构为运算符,将汉字描述为前缀表达式。提出汉字表达式的双链表存储模型,设计双链表生成算法及基于双链表存储的检索方法。与直接采用数组存储相比,使用双链表存储时检索的平均比较次数仅为数组存储的50%,并易于动态提升检索性能。  相似文献   

2.
为解决图像像素表示汉字特征方法不能有效表示汉字本质特征、空间复杂度较高的问题,提出了一种汉字图特征提取方法。方法主要包含汉字图像二值化,汉字图像骨架提取,汉字图特征提取3个部分;二值化消除图像中的噪声,提高图特征提取的准确度;骨架提取保留图像中重要的像素点,剔除无关的像素点;图特征提取将汉字关键点与图数据结构结合来表示汉字形状特征。在3 908个常用汉字的5种字体上进行实验。结果表明,该方法能够正确提取笔画复杂汉字的图特征,有效表示汉字本质特征;不同字体汉字图特征相同的汉字数量最高为3 195个,方法表现较稳定;平均每个汉字可以用22.6个图节点、19.1个边表示,相较于用单通道图像表示汉字特征,可大幅降低空间复杂度。  相似文献   

3.
针对汉字字形设计和开发的困难, 提出基于特征点抽象的汉字字形描述方法和汉字字形生成方法, 研究特征点、特征表达式、特征点的权值和权矢量等在汉字字形生成中的应用技术和方法, 并以点的生成为例, 设计汉字点笔画的生成算法, 并进行验证实验。实验结果证明该算法可靠并实用, 可切实提高汉字字形设计的效率, 为汉字其他笔画的生成提供一种解决方案。  相似文献   

4.
一种基于字符轮廓特征的印刷体汉字切分方法   总被引:1,自引:0,他引:1  
针对单一汉字切分方法的不足,提出一种基于字符轮廓凹凸特征的印刷体汉字切分方法,首先对扫描后的印刷体汉字文本图像进行二值化处理,根据整篇汉字字符的左右轮廓凹凸特征,把字符图像切成一个个的汉字行,最后根据每一个汉字行的字符串上下轮廓凹凸特征,把每一个汉字行切分为单独的汉字字符.仿真实验表明,提出的方法对于标准的纯印刷体汉字文本图像,可以得到比较理想的切分效果.  相似文献   

5.
从汉字的结构特征出发,定义了表示汉字的结构文法,给出了相应汉字的语法树和编码表达式,并成功地把它们应用于汉字信息统计方面,具有一定的实用价值。  相似文献   

6.
古籍汉字图像检索是古籍汉字研究的有效工具.然而,古籍汉字字形复杂、书写风格多变的特点导致传统文字图像检索技术在应用于古籍汉字图像时效果欠佳.针对现有方法在古籍汉字图像特征提取时存在的字形结构细节信息和低层视觉特征提取问题,设计了一种融合空间注意力和通道注意力网络高低层特征的古籍汉字图像检索模型.首先,融合空间注意力的低维特征和通道注意力的高维特征,捕捉古籍汉字空间结构间的依赖关系,提取更丰富的古籍汉字语义特征信息;其次,构建inception残差结构模块,丰富古籍汉字图像特征的感受野,使网络模型更易优化,保留足够的古籍汉字细节信息;最后,运用加权交叉熵损失函数,解决数据集中存在的正负样本不平衡问题,增强检索模型的鲁棒性.在上下、左右、包围和独体结构古籍汉字图像数据集上检索实验的MAP(mean average precision)值分别为77.89%、79.89%、78.21%、80.75%,表明了方法的有效性.  相似文献   

7.
一种基于曲线匹配的印鉴图像自动检索方法   总被引:3,自引:0,他引:3  
从汉字笔划横平竖直这一特点出发,提出了汉字图像中适合于印鉴图像检索的两种特征:汉字的外边缘轮廓和汉字的方向投影密度.进而用函数曲线对这两种特征进行量化描述,将对汉字的匹配归结为对函数曲线的匹配.最后通过实验验证了这两种特征的稳定性以及基于这两种特征的曲线匹配方法的有效性.  相似文献   

8.
基于笔画分析和背景细化的粘连手写汉字切分   总被引:5,自引:0,他引:5  
离线手写汉字的切分是识别的前提,其中粘连手写汉字的切分最为困难。提出一种基于笔画分析和背景细化的粘连手写汉字的切分新方法。对粘连字符图像作细化处理,检测端点、叉点和角点等特征点,根据特征点提取笔段。按笔段的长度、相互之间的位置关系以及投影信息确定切分点。细化粘连字符的背景图像,从切分点出发在细化的背景中选取分割路径,实现粘连手写汉字的切分。实验表明,本方法对于粘连手写汉字具有令人满意的切分效果。  相似文献   

9.
基于笔划方向特征和非对称分布的手写体汉字识别模型,提出一种从手写体汉字骨骼图像上提取分叉点的有效改进算法,保证笔划提取的可靠性,并直接从笔划结构上计算统计识别特征矢量;采用主向量空间的非对称参数分布模型计算距离测度.实验表明,基于笔划方向特征和非对称分布的统计识别模型具有优良的识别性能.  相似文献   

10.
基于有效鉴别特征抽取的有限汉字集识别   总被引:3,自引:0,他引:3  
在模式识别领域,基于Fisher鉴别准则函数的最佳鉴别矢量集技术有着重大的影响,根据统计不相关性最优鉴别变换,提出了在汽车牌照二值化图像中抽取汉字字符的有效鉴别特征方法,并将其应用于沪宁高速公路收费口处实拍的车牌图像库中,其识别率达97.13%,实验结果表明,此文所提出的牌照图中汉字字符集的有效鉴别特征方法是有效的。  相似文献   

11.
介绍在西环境下显示汉字中信息及制作小型汉字库的原理及方法,同时给出了该方法的实现过程,并利用C语言对主要过程算法作描述,相关程序均在Turbo C(ver2.0)集成开发环境下编译通过。该实现方法无需中环境支持,因此可以为用户节约资源,提高系统的运行速度和资源利用效率。  相似文献   

12.
用分类方法为汉字编码,简捷直观,便于编制输入软件.作为典型例子,选择一个最小的汉字库、一个最常用的汉字库和一个目前最完备的大汉字库,设计制作了汉字输入系统,使小字库上的数码可作为大字库上的简码,十分方便易学好用.大道至繁至简,汉字本身存在一字多音、一字多义、一字多形的实况,从而导致汉字编码可以规范方法解决输入系统一字多码和一码多字的问题.  相似文献   

13.
本文通过对NZK一I型汉字产生器接口技术的剖析,说明把汉字库设计成一种智能的I/O设备,可与主机一起构成多CPU系统.这种结构对于绝大多数的微型计算机系统的汉字信息处理是一种行之有效的办法.  相似文献   

14.
汉字的层次轮廓特征及其应用   总被引:5,自引:0,他引:5  
汉字特征的描述与匹配,是汉字识别研究中的两个重要问题。从上下左右四个不同的方向看一个汉字,在不同的层次和位置,可以得到不同的曲线段,这些曲线段是汉字笔划的反映,唯一地确定了汉字的结构。基于这一观点,本文从轮廓的角度,给出了汉字特征的一种形式化描述方法,提出了汉字的层次轮廓概念,给出了相应的局部最优匹配算法,最后,将该方法应用于特定人脱机手写体汉字识别中,取得了较为理想的效果。  相似文献   

15.
汉字起源"渐变论"包含三层意思:一是在较为完整的汉字系统形成之前,类似于汉字的记事符号已有充分储备;二是从记事符号到汉字系统是一个很长的历史过程;三是汉字系统的形成是人民群众集体智慧的结晶。从目前发现的中国最早的成系统的文字甲骨文来看,早期记事符号的数量并不足以成为甲骨文形成的基础;从文字系统形成所需要的技术条件来看,单纯的符号积累也不足以产生完整的文字系统。综合分析,汉字系统的形成实际上是在一个较短时期内由少数人完成的。  相似文献   

16.
汉字是表义文字,从汉字的体制看,汉字有语素字和非语素字,从汉字的字音看,汉字不光有单音字,还有许多多音字,从汉字的形体看,汉字是由笔画构成的,有不少汉字的形体相近或相似,构成了形近字。这些语素字、非语素字、多音字和形近字出现在普通话水平测试(PSC)的单字试题中,用来检测应试者的普通话水平,应试者的错误率极高,严重影响普通话测试目标的实现。本文根据汉语言文字的特点,提出改变试题的形式,以期真正实现测试目标。  相似文献   

17.
为了模拟汉语初学者的汉字认知过程,在Kohonen神经网络的基础上,改进了其网络结构和算法,并且将改进后的网络输出层根据Hebbian学习规则连接,构建了一个多Kohonen网络协同工作的汉字认知自组织神经网络模型.模拟研究结果表明,模型能够成功地学习到汉字的结构类型,且能有效识别出汉字的部件,在一定程度上模拟了汉字认知的部分过程,说明该模型用于汉字认知乃至汉语言习得的可行性.  相似文献   

18.
字符浅议     
字符的判定标准是一个有争议的问题,学界的观点可谓异说纷呈、百花齐放.文章对各家观点进行了评述,对字符的概念、分类和功能进行了论述.认为字符可以是一个完整的单字,也可以作为一个合体汉字的构字单位,前者叫成字字符,后者叫不成字字符.字符从共时平面分为四类:音符、意符、记号(形符、标符)、兼符;从历时平面上分为五类:图符、音符、意符、记号(形符、标符)、兼符.字符的功能可以决定汉字性质及其他文字分类;明确汉字结构;有助于对外汉语教学.  相似文献   

19.
方块古壮字作为一种逐渐衰落的古文字,近年来引起了广大学者的关注,这有力地推进了民族文化的传承。可以在前贤的研究基础上,利用数据库,从文字学角度出发,通过定量和定性研究方式对方块古壮文的来源问题进行分析。若以字的形体为研究对象,不难发现,借源方块古壮字中的同形汉字与汉字之间有密切联系。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号