首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
现代汉字构字法的研究对于汉字教学和中文信息处理有着极其重要的意义.现代汉字由部件构成,其构字形式主要有七种,故现代汉字也相应地分为七类.本文着重探讨了第一级部件即意符、音符和记号的确定问题.  相似文献   

2.
1 拼音编码的弊病 当前,我国现有的汉字编码方案有几百种,但是,归纳起来,可以分为3大类;(1)音符类,(2)形符类,(3)音形结合类.所谓音符类,即单纯以汉字的读音编码,如:双拼、全拼,有的在拼音的后面加上音调码,以区分同音字,减少同码字.这类编码好学,容易掌握,只要学会了拼音,就会输入汉字.但是,我国汉字数量多,就国家公布的《信息交换用汉字编码字符集——基本集》中所收字量也有6763  相似文献   

3.
本文讨论了部件分析的三个问题(1)部件的定义;(2)独体字和合体字;(3)音符和意符.汉字现状的分析和溯源的分析,着眼点不同,只有摆脱传统"六书"理论的阴影才能构建起现代汉字字形分析的科学体系.  相似文献   

4.
记录汉语的汉字系统里存在着大量的异体字,对异体字的研究可以是多角度和多层面的。将《说文解字》中记录动词的异体字比较其意符差异,可以看出汉字意符的选择是多渠道多侧面的,所以构成异体字的形符不同的原因也是多样的,远远不限于义近或者形近形符的通用。  相似文献   

5.
汉字作为记录汉语的符号,在与汉语发生联系的同时就获得了记录汉语的音响形式的职能,具有了表音性.汉字靠音符记录汉语的音节,靠意符来跟语素的意义发生联系,既使用属于语素这个层面的字符,又使用表音节的字符,是一种"语素-音节文字".  相似文献   

6.
字符切分是影响OCR系统识别的关键因素之一.对于中英文混排文档,提出了基于字符类别的识别反馈混排字符切分方法,利用字符特征分类判别出文档中的汉字类、英文、数字和标点符号类、部件类,对汉字类和部件类借助识别技术分别进行处理.该方法结构简单,客易实现,实验结果表明该方法切分效果好,字符类别判断准确.  相似文献   

7.
邓明 《晋中学院学报》2012,29(5):94-96,121
形旁的功能是指示形声字的意义或意义范畴,而指示意义或意义范畴的途径是多种多样的:有的形旁是单纯的表形符号(形符),有的形旁是双重的形意符号(形意符),有的形旁是纯粹的表意符号(意符).由于形旁系统内部存在表形符号和表意符号的对立,所以用形旁(形符)或意符来表示“形声字的表意部分”,既不全面,也不准确.引入并明确形符、形意符、意符这些概念,对于认识形旁系统的复杂性和多样性,进而有效地把握和推断所辖形声字的意义范畴,是大有裨益的.  相似文献   

8.
QR code二维条码数据编码的研究   总被引:2,自引:0,他引:2  
为了实现二维条码的超大容量和高效汉字表示,应用快速响应矩阵码(QR code)进行编码.QR code码可以对任何类型数据,如数字、字母、字节以及汉字等进行编码.汉字模式下输入字符被压缩成13 bit二进制数,然后将二进制数连接起来,并在前面加上模式指示符、汉字子集指示符和字符计数指示符.在对输入数据进行汉字编码时,发现国家标准(GB/T 18284-2000)中存在错误,生成的数据位流超出国标中规定的符号数据容量.提出了3种修订方法,修改了国标中汉字模式的数据容量.测试结果表明所提方法是可行和有效的.  相似文献   

9.
形声是汉字四种造字方法中的一种,形符是形声字的一个主要的组成要素。形符的产生方式有多种,通过诸多的方式产生的形符具有表义和区别、指示的作用。形符的产生和发展经历了一个漫长的过程,形符和字义的关系有多种不同的情况。经过历史的选择,最终形符在形声字中定形定位,并且形成众多存在互补关系的形符群。这些形符群包括了社会生活的所有方面,因此由此产生的形声字也形成囊括可以表达社会生活所有内容的系统。对于形符的研究直接关系到形声字的研究成果以及汉字的优化和未来的命运,因此不容忽视。  相似文献   

10.
从来源上看,形声字的形符由纯表意字而来,主要是主观表义;从构字特征上看,形符既有多形、省形,也有形符的代换和变形;从构字功能上看,形符的构字功能不是太强,形声字的发展不以形符构字功能的增强为特征;从表义功能上看,形符表义有具体性也有系统性。  相似文献   

11.
汉字是表义文字,从汉字的体制看,汉字有语素字和非语素字,从汉字的字音看,汉字不光有单音字,还有许多多音字,从汉字的形体看,汉字是由笔画构成的,有不少汉字的形体相近或相似,构成了形近字。这些语素字、非语素字、多音字和形近字出现在普通话水平测试(PSC)的单字试题中,用来检测应试者的普通话水平,应试者的错误率极高,严重影响普通话测试目标的实现。本文根据汉语言文字的特点,提出改变试题的形式,以期真正实现测试目标。  相似文献   

12.
汉字的层次轮廓特征及其应用   总被引:5,自引:0,他引:5  
汉字特征的描述与匹配,是汉字识别研究中的两个重要问题。从上下左右四个不同的方向看一个汉字,在不同的层次和位置,可以得到不同的曲线段,这些曲线段是汉字笔划的反映,唯一地确定了汉字的结构。基于这一观点,本文从轮廓的角度,给出了汉字特征的一种形式化描述方法,提出了汉字的层次轮廓概念,给出了相应的局部最优匹配算法,最后,将该方法应用于特定人脱机手写体汉字识别中,取得了较为理想的效果。  相似文献   

13.
特征抽取是识别中的重要步骤,提取描述性强的特征能够有效提高分类器的识别效率。在提出有关概念的基础上,介绍了特征行抽取在字符过程中的两个重要应用。首先,在分类识别时可用作匹配的特征向量,通过双向匹配来识别独立的字符。其次,可在识别粘连字符时用于预测前端字符,并在提取前端字符后对预测结果进行验证,从而达到准确分割和识别粘连字符的目的。还详细描述了交互确定特征行的方法。最后根据实验数据对字符特征行的应用价值作出了评价。  相似文献   

14.
吴琴霞 《科学技术与工程》2013,13(15):4426-4432
目前汉字字形的生成仍是手工劳动和人工设计,加上汉字数据量巨大截止到现在没有一种合适的字形自动化生成工具可以使用。针对这一难题提出了一种基于字形描述库的汉字字形自动生成的技术。该技术先将汉字字形与字形描述库映射,以字形描述库为桥梁将汉字字形数据化,然后通过查找字形描述库找到汉字对应的骨架信息,提取笔画骨架。最后通过数据的逆向处理将笔画骨架信息还原为各种汉字字形,形成汉字字形库。  相似文献   

15.
本文提出了一种新的描述多种印刷体汉字的方法——特征链码法.使用该方法无需先对汉字图像进行细化和平滑处理,可以克服汉字图像位移、不同大小以及一些噪声的影响.实验中针对常用的一级字库约3700个仿宋体、宋体、黑体(理论上还可以扩充到二级字库6700多个印刷体汉字,字体还可以增加楷体等),以及相应的尺寸出现的变化如24×24、24×48、48×48等做了特征抽取和识别试验,实验中还对链码特征库进行了几种预分类.  相似文献   

16.
诱导特征标研究群G的特征标与它的子群的特征标之间的关系, 其主要目的是利用G的子群已知的不可约特征标来获得G的一些不可约特征标, 从而了解G的结构.McKay猜想断言: 设G为任意有限群, p为任意素数, N为G的一个Sylow p-子群P在G中的正规化子, 则G和N的p′-次不可约复特征标的个数恰好相等. 显然N的每个p′-次不可约复特征标在P上的限制均为线性特征标.在研究G和N的p′-次不可约复特征标之间可能存在的典范对应时,Navarro于2003年在J.Alg上发表了关于Sylow p-子群P的线性特征标到N和G的诱导性质. 本文利用特征标的诱导公式,通过研究群与子群的共轭类关系,将其中的Sylow p-子群替换为π-Hall 子群,对Navarro文中的3个主要定理做了更进一步的推广,这同时是对McKay猜想π-形式的研究.  相似文献   

17.
为实现按部件快速检索汉字,把汉字递归表示为汉字结构、字首部件和字尾部件三元组。以部件为运算对象,字型结构为运算符,将汉字描述为前缀表达式。提出汉字表达式的双链表存储模型,设计双链表生成算法及基于双链表存储的检索方法。与直接采用数组存储相比,使用双链表存储时检索的平均比较次数仅为数组存储的50%,并易于动态提升检索性能。  相似文献   

18.
基于笔划和笔顺的汉字识别算法   总被引:4,自引:0,他引:4  
以笔划为基元结构笔划的顺序来表示汉字的结构信息,在此基础上提出了一种笔写汉字识虽的匹配算法,对于结构类似的汉字,该算法可以通过特征关系予以识别,从而提高汉字的识别率。  相似文献   

19.
如果有限群G的任意非线性不可约特征标均为实值特征标,则称G为R1-群.考察了R1-群的性质和结构,与Chillag和Mann关于R1-群的结论相比,主要从特征标角度讨论了R1-群的结构.  相似文献   

20.
用分类方法为汉字编码,简捷直观,便于编制输入软件.作为典型例子,选择一个最小的汉字库、一个最常用的汉字库和一个目前最完备的大汉字库,设计制作了汉字输入系统,使小字库上的数码可作为大字库上的简码,十分方便易学好用.大道至繁至简,汉字本身存在一字多音、一字多义、一字多形的实况,从而导致汉字编码可以规范方法解决输入系统一字多码和一码多字的问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号