首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 312 毫秒
1.
在许多文字识别系统中,字符切分是预处理阶段的重要环节,其目的是从文本图像中分离出字母图像,然后针对切分后的每个字母进行识别。为了达到字符切分的目的首先要切分出文本图像中的每一个连体字母段。本文将彩色图像转换为灰度化的边缘图像,其次对图像进行局域二值化,再进行区域检测,初步实现了图像中维吾尔文字行的定位,然后根据定位结果从图像中切分出文字行,统计切分后的文字行在水平和垂直方向上的像素累计情况,查找最佳切分点,分离出文字行中的字母独立形式或几个字母连成的连体字母段,对后面的字符切分打了很好的基础。实验结果表明,文字行的切分准确率达到92%,字切分准确率达到90%以上。  相似文献   

2.
现代藏文自动校对中,对音节字( )的校对是其基础。在藏文文本中音节字是用音节点进行间隔的,由于藏文二维的书写特征和音节字形成过程中与其构件之间严格的搭配规则等诸多问题,使得对它的校对又区别于任何一种文字。文章介绍了音节字的构件、结构和搭配规则等问题,列举了藏文音节字中的错误类型,并针对其特殊性给出了一个特有的音节字校对的流程和方法。  相似文献   

3.
为满足西夏文字信息处理的需要,建立了西夏编码字符集,讨论了西夏字的基本属性和几种编码方案,并给出了按字形开往编码的甄别规则以及对特例的约定。  相似文献   

4.
成耀  王晓瑜  顾翔  鲁松 《科技信息》2012,(35):38-38
个性化字库自动生成研究的核心是抠字,本文研究的基于VB的抠字算法可以对扫描的图像文件进行自动识别、自动按实际大小切割,将手工书写的汉字做成一个个高点阵的字模文件以图片方式自动存储。  相似文献   

5.
越南岱侬族喃字初探   总被引:1,自引:0,他引:1  
越南岱侬族喃字是岱侬族人使用过的一种与中国古壮字相类似的方块文字。对岱侬喃字书面材料进行分析,发现喃字实际上是用以记录汉、越、岱侬三种不同语言的词汇,在字的来源上也可分为汉字、岱侬自造喃字和越南自造喃字三类。岱侬喃字体现了境外壮侗语族人民在发展民族文字方面所作的努力。  相似文献   

6.
本文对古汉字和古埃及圣书字两种文字中的形声字的声旁,作了共时和历时两个平面的对比。二者在共时平面(总数、表音类化程度、表音功能三个方面)表现出很大的差异,而这些差异是因为两种文字的形声字具有不同的产生机制。古汉字形声字主要是在明确表意的目标下产生的,而古埃及圣书字的形声字是在记音不自足的情况下产生的。然后从语言类型、语音特点和方言三个方面探讨了二者为什么会有不同的形声化机制。最后指出汉字声旁的表意、别义性质是汉字坚持表意路线的重要原因;圣书字形声字声旁的记音性质体现出向拼音文字发展的趋势。  相似文献   

7.
论古今字     
汉语的一个词,开始用某个字来表示,后来改用另一个字表示,而后来的这个字又是专门为表示这个词而造的,这两个字合称古今字,通假字则不然,它是“本有其字,同音代替”,用来代替的字和本字并存。古今字分为三种不同类型。  相似文献   

8.
同形字是指汉字字库中字形相同,音义不同的字,即一个字符记录了几个音义之间互无联系的词.系统、全面研究同形字,对于文字训诂、汉字发展史的研究,对于文献的识读与整理、字词典的编纂等都具有积极的意义.以汉魏六朝石刻中的同形字为基本材料,就其出现的时间、类型、产生原因、发展趋向等问题进行分析研究.  相似文献   

9.
本有其字的假借,一般认为有仓促之间写了别字,但实际情况可能要复杂得多。东巴文本有其字的假借产生的原因主要有:别音义、避重复、求新奇、不规范、仿古。这对研究其他文字本有其字假借字的产生,有一定参考价值。  相似文献   

10.
刘伟杰 《潍坊学院学报》2010,10(5):80-81,91
清人多有《急就篇》中没有重复用字的说法,其影响及于晚近,这其实是不确切的。陈黎明先生首先对《急就》本文作了统计,发现共有239个重见字。但由于使用版本及文字由繁转简时出现的问题,陈氏的统计小有失误。本文对《急就篇》原文三十一章的重复字重新进行了准确的统计,并且按顺序标出了各字重复出现的章数,非常方便学者利用。  相似文献   

11.
对汉字古今字的再界定   总被引:2,自引:0,他引:2  
古今字是汉字发展演变过程中产生的一种字现象,与通假字、异体字、同源字有着千丝万缕联系,又有着明显差异。本明其同,辨其异,旨在对古今字的定义、范围作再界定。  相似文献   

12.
射字法是民间流行的一种猜字游戏,其继南宋赵与时《宾退录》和元代陶宗仪《辍耕录》的记载之后,仍然散见于明清时期各种韵书中。以明清时期五种韵书所记载的射字法为例,展示其形式多样,但本质都是对韵书韵字声、韵、调的拆分及组合。射字法不仅是古时读书人熟稔官韵韵部的好方法,同时射字游戏所使用的韵书或韵图反映了当时社会的实际语音面貌,因此它在语音史的研究上也具有重要作用。  相似文献   

13.
么春艳 《科技信息》2011,(32):I0082-I0082
在成语中,有一种在形式和意义上都具有独特性的四字格结构,它具有结构成分的成词性、结构形式的相对固定性、结构意义的整体性等特点。从结构上可以分为A/B/C/D式、AA/BB式、AB/A'B'式三种结构。本文在结构、类型、语序和意义四个方面举例说明四字成语与四字格的区别,认为固化成为成语将是四字骈语的发展趋势,而四字并列成语的定义与范围也将越来越宽泛。  相似文献   

14.
以真假字判断任务为研究范式,考查汉字单字识别的正字法加工是否受字频、部件频率、部件数和目标字类型等因素的影响,从而探讨正字法的加工方式。结果表明:字频、部件数和目标字类型对汉字识别的正字法加工存在显著影响;部件频率对汉字正字法识别的影响不显著。结果证实,汉字单字识别的正字法加工存在两种加工方式并存的现象。  相似文献   

15.
此声字考释     
依据王国维"补高邮王氏说文谐声谱"选取《说文解字》中从"此"得声的一组形声字作为考释对象,试图从中梳理出字族,旨在辨清母文和母文孳乳字之间的孳乳分化关系,把握汉字在发展孳乳过程中的内在联系性,进一步探索汉字孳乳发展的内部规律,从而在动态发展中了解汉字、把握汉字。  相似文献   

16.
从节奏、文学传统和文字特点三方面讨论了英汉翻译中的四字格运用。  相似文献   

17.
《说文》对"匕"字的解释包含两层意思,"相与比叙"和"用以取饭的器具"。从古文字字形考察,是原本来源不同的两个字混同为一个字。在《说文》系统中,"匕"部字和其他含有"匕"部件字构意大体不出《说文》的解释,结合古文字和相关文献,可以进一步理顺相关字的释义。  相似文献   

18.
字向量表示质量对中文文本处理方法有重要影响。目前,常用中文字向量表示方法Word2Vec、GloVe在很多任务中表现优异,但存在向量质量依赖训练数据集、稳定性差、没有考虑汉字整体字形结构所隐含的语义信息、没有利用字典包含的语言知识等问题。为了克服现有方法的不足,该文首先采用字形自编码器自动捕获汉字字形蕴含的语义,再利用字义自编码器抽取字典包含的稳定字义信息,提出了融合中文字形和字义的字向量的表示方法(Glyph and Meaning to Vector)。结果表明,GnM2Vec在近邻字计算、中文命名实体识别和中文分词三项任务中均取得了较好的结果,在命名实体识别中,F1值较GloVe、word2vec、G2Vec(基于字形向量)分别提高了2.25、0.05、0.3;在中文分词中,F1值分别提高了0.3、0.14、0.33,提高了字向量稳定性。  相似文献   

19.
研究满足下列条件的无限字w:如果x是w的子字,并且|x|至少取k(k是某个固定正整数),那么x的补字不是w的子字.给出了k≤4时所有这种无限字.  相似文献   

20.
支声字考释     
依据王国维“补高邮王氏说文谐声谱”选取《说文解字》中从支得声的一组形声字作为考释对象,试图从中梳理出字族,旨在辨清母文和母文孳乳字之间的孳乳分化关系,把握汉字发展孳乳过程中的内在联系性,进一步探索汉字孳乳发展的内部规律,从而在动态发展中了解汉字,把握汉字。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号