首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
本文通过字例分析认为,方块壮字来源有三个方面:一是借用汉字,二是改造汉字,三是自行构造。  相似文献   

2.
对西夏字的三种计算机表示方式和西夏字的结构分析方法进行了研究,并应用拓朴和几何的基本原理,分析了西夏字的结构及其制约关系,提出了一种基于Fourier 变换的西夏轮廓字生成算法.  相似文献   

3.
通假字与古今字是古代汉语里一对常见的概念,然而在现在的教材和学术著作中,二者的界限和分类仍比较混乱。本文试分析其中原因,并提出具体的解决办法。  相似文献   

4.
5.
为满足西夏文字信息处理的需要,建立了西夏编码字符集,讨论了西夏字的基本属性和几种编码方案,并给出了按字形开往编码的甄别规则以及对特例的约定。  相似文献   

6.
字本位理论有着深厚的文化传统和广泛的群众基础,它重新发现了字,实现了汉语研究立足点的转移;字本位理论作为汉语的语言学理论,涵盖了古今汉语;“字的语法化的三阶”说,是运用字本位理论来建立汉语语法体系的尝试,也是字本位理论趋于完善的重要标志;目前字本位理论只是建立了一个理论框架,最终取得普遍认同,还有待于信息处理的丰硕成果。  相似文献   

7.
越南岱侬族喃字初探   总被引:1,自引:0,他引:1  
越南岱侬族喃字是岱侬族人使用过的一种与中国古壮字相类似的方块文字。对岱侬喃字书面材料进行分析,发现喃字实际上是用以记录汉、越、岱侬三种不同语言的词汇,在字的来源上也可分为汉字、岱侬自造喃字和越南自造喃字三类。岱侬喃字体现了境外壮侗语族人民在发展民族文字方面所作的努力。  相似文献   

8.
音字转换是汉字的语音输入系统的一个主要组成部分,音字转换的速度和准确性直接影响整系统的性能。本文提出在音字转换过程中利用字词的概率统计信息进行辅助判决的方法,优化字词的选择,提高音字转换的速度,考虑到人们用词的时变性,提出一种在使用过程中对字词频进行智能调整的算法,并引入遗忘机制以适应词频的减量变化。  相似文献   

9.
现代汉语根字属性及其归类构词的基本规律,使得归类构词成为现代汉语的一大优势,大大提高了汉字的复用率和汉语词汇的识别率,使汉语成为一种“简捷高效”的语言。  相似文献   

10.
由于方言演变的速度和进程不尽相同,微母字声母在现代汉语方言中呈现出不同的演变层次。江汉平原有不少方言的微母字至今仍保留中古重唇音[m],在西南官话乃至整个官话中,这是非常特殊的现象。江汉平原诸方言的归属值得商榷,它们属于北方话和南方话之间的过渡带方言。  相似文献   

11.
正1.给——爸爸专门给(gěi)我做了介绍,什么叫"部队给(ji)养"。2.种——我种(zhòng)下的太阳花种(zhong)子,终于发芽了。3.间——这个房子里有一个衣帽间(jian),和它间(jiàn)隔一个房间(jian)的是储藏间(jian)。4.要——范老师要(yao)求我们,课堂上一定要(yào)保持好纪律。5.没——林立军还没(méi)反应过来,范老师就把他的变形金钢没(mò)收了。6.把——妈妈要我把(ba)菜刀刀把(bà)上的塑料纸撕下来。  相似文献   

12.
四字词组是汉语中常见的一种语言现象。它被大量运用于说话、文章里。自由四字词组不同于固定词组,它们是可以随意拆散,随意组合的。翻译自由四字词组有多种方法,有时英语中有基本对应的表达法,有时必须减译,有时必须增补词语,多个四字词组连用时则常用综合法。  相似文献   

13.
汉语连珠四字结构词义丰富,文采华丽,语气连贯,重在一股气势和意境。英译时应以中国社会的历史、文化、地缘等为立足点,根据不同情景采用直译法、意译法、合并法、提取法、变换词序、改变词性和就实避虚等手法来处理。  相似文献   

14.
四字格乃“华文所独”;四字格的修辞美体现在:一、音乐性;二、平稳性,三、简练性。汉语语汇所蕴藏的大量四字成语、熟语,悠久的文化历史对四字格的“预制加工”,以及由非四字格向四字格转化的极大可能性,使汉语四字格具有丰富的修辞特色和长盛不衰的生命力。  相似文献   

15.
研究满足下列条件的无限字w:如果x是w的子字,并且|x|至少取k(k是某个固定正整数),那么x的补字不是w的子字.给出了k≤4时所有这种无限字.  相似文献   

16.
汉语中有一种独特的现象,紧密结合在一起的四个字,存在着并列的语法关系,我们称之为并列四字格。并列四字格这种独特的格式,包含着深刻的文化意义。它反映出汉民族的认知特点、对事物的概括和归类方式等,是民族心理在语言上的映射。此外,从这种独特的格式中还能窥视出汉民族独特的二元思维方式。  相似文献   

17.
字向量表示质量对中文文本处理方法有重要影响。目前,常用中文字向量表示方法Word2Vec、GloVe在很多任务中表现优异,但存在向量质量依赖训练数据集、稳定性差、没有考虑汉字整体字形结构所隐含的语义信息、没有利用字典包含的语言知识等问题。为了克服现有方法的不足,该文首先采用字形自编码器自动捕获汉字字形蕴含的语义,再利用字义自编码器抽取字典包含的稳定字义信息,提出了融合中文字形和字义的字向量的表示方法(Glyph and Meaning to Vector)。结果表明,GnM2Vec在近邻字计算、中文命名实体识别和中文分词三项任务中均取得了较好的结果,在命名实体识别中,F1值较GloVe、word2vec、G2Vec(基于字形向量)分别提高了2.25、0.05、0.3;在中文分词中,F1值分别提高了0.3、0.14、0.33,提高了字向量稳定性。  相似文献   

18.
为解决现有中文字向量表征方法中字形特征利用不充分的问题,利用矢量图形的尺度不变性,提出了一种面向汉字矢量图形特征的字向量 (scalable vector graphics to vector,SVG2vec)表征方法。预处理阶段将汉字像素图像转化矢量图形,生成字形矢量坐标对序列;特征学习阶段采用双向循环神经网络 (Recurrent Neural Network, RNN)和自回归混合密度循环神经网络构建矢量图形变分自编码器模型,利用模型学习汉字字形结构特征;向量生成阶段输入字形矢量坐标对序列到编码器,编码器将字形特征映射到概率连续分布空间,得到SVG2vec字向量。与已有字向量在不同层级任务上进行对比实验。结果表明:SVG2vec向量在命名实体识别、中文分词和短文本相似度计算实验中,F1均值比Word2vec、GloVe等未利用字形特征的向量分别提高了1.27、0.4,1.67、0.12,3.28、2.03,比glyph and meaning to vector (GnM2Vec)、Character-enhanced Word Embedding (CWE)等利用字形特征的向量分别提高了1.02、1.07,1.69、1.34,0.04、0.31,SVG2vec能更有效利用汉字字形特征。  相似文献   

19.
佛经翻译利用并激活了汉语固有的四字格模式,使其构词能力大大加强,直接或间接地推动了汉语四字格的蓬勃发展。首先,佛经翻译的影响是汉语双音化在魏晋时期步伐加快的重要动因。由此导致了多种构词法的增长和完善;其次,佛经翻译对新文体及与之相适应的四字句的选用.促成了汉语四字格独特的2 2节奏倾向的形成;再次,佛经翻译的口语化倾向影响到各种通俗文学体裁,尤其与后代白话小说中大量出现的四字格俗语有关;最后,源于佛教的四字格成语占了汉语史上外来成语的最高比例.它们与汉语成语融会在一起,成为汉语的有机组成部分。  相似文献   

20.
设w是{0,1}上一个无限字,若x是w的子字,且|x|≥k(k为正整数),则x的补字x-不是w的子字,那么称w是一个k补子字自由的无限字.文章给出了k补子字自由无限字的若干刻画.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号