首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
中华民族几千年有赖文字之统一而凝聚为一个密不可分的群体。汉字具有不同于一般字母文字的强烈非线性特征,汉语字频统计发现,学习汉语比学习其它语言也许更容易些。本文分析了汉字字音的莱维(Paul Lévy)稳定分布和高频字分布规律,指出为了子孙后代学习和交流的方便,也为了汉语文化的发扬光大,应当联合包括台湾在内的广大华语世界尝试筛选制定一个4500字的左右的标准小字符集。今天海峡两岸朋友在这里聚会,探讨如何迎接信息(information)时代的挑战。“信息”是大陆的叫法,在港台一般叫“资讯”。此外还有许多名词译法不同,如只读存储器与“唯读记忆体”,磁盘与“磁碟”,分形与“碎形”,等离子体与“电浆”等等。不能简单地说谁的叫法更好(各有长处),这种局面是长期以来大陆与海外语言文字和科学名词审定部门缺乏足够沟通的结果。现在海内外各种汉字信息交换字符集与代码标准相差甚远,此外还有汉字的简体与繁体等问题。本文探讨构造、筛选一种通用小字符集的可能性。一、汉字的现状中华民族是多民族的联合体,文化传承及国家统一都有赖于汉字的普遍使用和字形的长时期相对稳定。各地的人们说话尽可以南腔北调,但写出来却一个模样。但是近半个世纪,由于实施简化方案,汉字字形却发生了极大的变化。特别是祖国大陆与海外华人社会过去相当长时间内缺乏必要的沟通,汉字演化走向了不同的道路。随着信息社会的到来,大陆与台湾又各自独立地制定了不同的信息交换标准代码和基本字符集。大陆1980年制定国标字符集(GB2312-80),收字6700多个,其中一级字3755个,二级字2969个,二级字符中还有39个非字字符;台湾制定了大五码(BIG5),收字13500余个。后来又有了中、日、韩大字符集(CJK)和国际标准汉字大字符集的汉字输入方法的流行,以及新闻出版业告别铅排而百分之百依赖于计算机,汉字字符集对中华民族语言文字的影响已是至关重要的了。发展到现在,海外沿用繁体字,大陆则大量使用简化字。海内外中文文字信息交流出现诸多不便,计算机汉字平台互不兼容(早期),在因特网(Internet)上阅读各自的文本也必须经过相应的转换,由于并非一一对应,转换中也出现了一些笑话,如“乾”与“干”。这种局面对汉语文化交流的长远影响值得关注。对于目前年龄在30岁以上的人,简繁的区分还不是本质上的,这些人对两种字形都还认识,而对年轻的朋友而言简繁的不同将是根本性的了。伴随信息时代的到来,海内外文字改革需要加强联系,增加共性,减少个性。一种长远的设想是建立一个大家都能接受的标准。我个人的初步想法是,构造一个通用的小字符集,简繁仍在相当长时间内保持并用局面。这种设想的必要性是:1)便于子孙后代学习汉字,发扬中华文化;2)适应信息社会信息的大量传输。下面着重谈可能性,分别从字音分布和字频分布考虑。二、汉字字音的稳定分布特征分形理论创始人芒德勃罗(B.B.Mandelbrot)早期曾从其老师莱维(Paul Lévy)那里学来“稳定分布”(stable distribution)的概念,并将它用于词频分布和收入分布研究,后来竟创立了分形科学。稳定分布概念应该是概率论和随机过程理论中十分重要的内容,但现在许多教科书并不讲,我们知道布朗运动的基本思想是随机行走,所使用的基本数学是高斯正态分布。对于一维的N步随机行走,每一步的步长x是一随机变量,其概率分布为p(x),具有0均值。法国数学家莱维提出这样的问题:什么时候N步的总和的分布仍然具有与单步相似的(乘以一个标度因子)分布?这等于问,整体与部分何时有相似性,因而很自然与分形有关。对此问题通常的想当然的回答是高斯过程,因为N步高斯分布加起来仍然是高斯分布。但是莱维一般地证明了,此问题还有其他解。早在1853年柯西(A.-L.Cauchy)就认识到对于N步可加(也叫稳定)随机过程,除了高斯分布作为其显然解外,还存在其他可能的解。当把x实空间变换为傅里叶(Fourier)k空间时,可加过程的可能概率分布为N(k)=exp(-N|k|β)。当β等于1时,便得到柯西分布,β等于2时对应于高斯分布。如今上式称为莱维概率分布。应当说明的是,广义的莱维稳定过程(sD1+sD2=sD,s1X1+s2X2=sX+常数),仅对三种极特殊的情况,可以解析地求出稳定概率分布。当x的绝对值很大时,返回到实x空间,p(x)可以用|x|1β来近似。当β小于2时,显然p(x)的二阶矩无穷大。这意味着除了在高斯情形中,随机行走(飞行)没有特征尺度。正是这一性质决定此类随机行走是标度不变的分形。今天我们用稳定分布和分形的观点考察汉字字符集,根据有关资料绘制了图1,图中有三条曲线,分别代表国标一级汉字、国标二级汉字和全体汉字(以《汉字信息字典》所收录的汉字代替)发音的首字母分布,三条曲线分别作了归一化处理,应作三点说明:1)图1以汉语拼音方案为准,但以其他注音方案统计,结果是一样的;2)在现代汉语拼音中I、U和V一般不作首字母出现,所以为0值;3)一级字样本数3755个,二级字样本数2969个,全部汉字样本数暂取11254个,后者大约是前者的3倍。图1 三种汉字字符集的字音分布图我们看到,三条曲线惊人地相似,归一化后差不多完全重合。这表明整体与部分之间只差一个标度因子,部分放大就是整体,整体缩小就是部分。换言之,大字符集与小字符集极其相似,部分可以一定意义上代替整体。三、汉字字频分布特征汉字是有别于字母文字的图形文字,造字原理东汉时许慎曾归纳为“六书”(象形、指事、会意、形声、转注、假借),其中又以“形声”字为主,大约占了80%。世界上许多文字最终都演化成字母文字,但汉字却基本没有什么变化。这种“停滞”值得研究,发展链条中止必有其内在原因。原因是什么?大概不止几条,但其一便是单字含义丰富,构词力强;其二便是汉字构成规律性强;其三是高频字相对于全部汉字而言极少。第一、二点可用汉字的非线性解释,这里谈第三点。有三件事值得指出:1)现代意义上的汉字频率研究始于1921年陈鹤琴用统计方法考察白话文中汉字出现频度。2)1974年8月原四机部、一机部、中国科学院、国家出版局和新华社联合向国家计委申请“汉字信息处理系统工程”项目,对各种出版物进行了全面统计,样本达21657039字,将汉字按使用频度分布5级;最常用字500个,常用字500个,次常用字500个,稀用字1500个,冷僻字2991个。3)80年代初上海汉语拼音文字研究组和上海交大共同发起编撰《汉字信息字典》。汉语似比英语、法语、德语难学,实际上未必。学英语掌握6000个单词只能算初级水平,许多材料无法看懂。但学汉语掌握1000个汉字就能读懂90%报刊文献资料。当然,不能仅仅作如此简单的对比,就得出汉语或汉字易学、具有优势的结论。但这是极重要的一个事实。图2示意了前31个高频字的频度曲线。以千分比计,“的”字出现频率竟达38.3,“一”达12.5,“是”达9.8,“在”达9.4,“了”达8.1等等。北京大学力学系朱照宣先生将前5个字编成一句话:“是的,了一在。”它是对“王力先生在家吗?”问话的回答。“了一”为语言学家王力教授的“字”。图2 前31个高频汉字相对频度图前28个字(正好到“到”字)累计频率达到201,也就是说,从概率角度看,只要学会28个字,100个字中就有20个认识,就能“看懂”汉语文献的五分之一。学会100个字,就能“看懂”40%;学会160个字,就能“看懂”50%;一天学一个,一年学会365个汉字,就能看懂70%的汉语文献。学会950个汉字大约能看懂90%的汉语文献。国标一级字共有3755个,而累计频率达到99.69768%,这说明国标一级字有充分的代表性。四、构造小字符集的可能性与困难由以上两小节可知,汉字虽然成千上万,但现实生活中实际使用的汉字只是其中一个很小的子集,也许正是这一原因使得汉字非常适用于人们日常生活和文化交流。在现代信息社会,作为一个有文化的人究竟认识多少字才算合格呢?与人们朴素的想法相反,并不需要认识许多字,有5000字足够了。开始时我也不相信,后来仔细核对了国标一级字和二级字,发现二级字中相当多不认识,甚至从未见过,而我个人阅读中文文献从未遇到过困难,我写的文章用过的汉字大概不超过4000个。那么一万多个汉字是作什么用的?20902个字符又是干什么的呢?我们不得不遗憾地说,这里面有一个很大的矛盾,是少数知识分子与广大平民百姓的矛盾。我们不妨看看字典中那些生僻的汉字,在现代社会只有极个别学究气十足的人故意使用大家都看不懂的文字,以显示学问的高深。从事中国古代文学、文化、文字等方面研究的,不在此列。为了适当照顾一些知识分子,短期内仍然可以有两套字符集并存,知识界用大字符集,普通百姓用小字符集。图书(特殊专业类图书除外)、广告、电视及其他大众媒体也应使用小字符集。上面第2小节内容说明,采用小字符集,仍然能够保证汉语的语音特征,而且保持得非常好。第3小节说明绝大部分汉字均已死亡,它们的使用频率极低,去掉那些很少使用的汉字不会影响汉语的丰富性和表义的准确性。海内外华人共商构造适用于信息社会的汉字小字符集的时机已经到来。采取的步骤可以是:1)海内外分别以大样本中文文献进行汉字信息统计分析;2)抛开意识形态因素,以汉字使用频率为主要指标筛选6000个通用汉字;3)海内外语言文字工作者协同商讨,将6000个汉字进一步缩减为4000~4500个;4)撇开频率因素,分类检查补漏,特别要考虑数字、计量单位、重要科学名词等;5)发布废止汉字及代替方案详表(如“吖”字完全可用“阿”取代,相应地“吖嗪”可用“阿秦”代替;“磲”用“渠”代替;“鄹”用“邹”代替;“蕞”用“最”代替等等);6)得到标准小字符集,在此基础上制定各种字模(如楷体、仿宋、报宋、综艺等)标准。鉴于大陆与海外简繁并用的现实,确定了小字符集后,严格规定简体与繁体,尽可能做到一一对应。从技术角度看,上述步骤不存在任何困难。但从政治、经济、社会文化角度,从习惯甚至恶习的角度看,仍然存在许多难点。最大的麻烦可能来自少数学究的抵制和意识形态方面的干扰。北京航空航天大学的一位博士曾说:“老百姓使用白字、通假字具有天然合法性,“韭菜”就是要写作“艽菜”(注:“艽”字在字典上读“jiāo”,与韭菜没关系),汉字必须简化并且所用总字数也必须减少。”我们反对两种极端态度:1)汉字完美无缺无需改革;2)汉字一无是处应当废止。折衷的办法是筛选汉字标准小字符集。五、问题目前我们缺乏对海外中文文献的统计分析以及对海外各种内码方案及中文平台的发展状况的了解,迫切需要与台湾、香港、新加坡甚至洛杉矶,泰国等地语言文字工作者和信息处理部门合作研究。此外,还要科学地评估此种小字符集可能对社会文化产生的长期负面影响。本文作者非语言文字工作者,只是个人关心这方面的话题 ,不当之处恳请批评。感谢北京大学物理系赵凯华教授和力学系朱照宣教授、北京理工大学孔昭君副教授提供有关资料和意见。图1 三种汉字字符集的字音分布图; 图2 前31个高频汉字相对频度图* 本文为1997年10月19日—26日海峡两岸青年学者论坛——迎接信息时代挑战学术研讨会论文,南京。  相似文献   

2.
汉字是世界上最古老的文字之一。对于这种有六千年左右历史的文化遗产,长期以来学者们褒贬不一,贬之为多。“难学、难写、难记”就是一大“罪状”,并以此作为中国文盲多的主要根源。近年来,一些中外学者从现代信息化时代的新特点出发,深入研究探讨,提出了新的见解。概况地说就是汉字具有“科学、易学、智能型、国际性”的优点,并预言:“二十一世纪将是汉字发挥威力的时代”[1]。本文仅对汉语科技术语进行解剖,探讨汉字及其术语的特点,使我们在科技术语命名和统一的工作中,认识并发挥汉字的长处,更好地弘扬汉字文化。一、汉字是古老而优秀的文字文字是记录语言的符号,是语言的书面形式。和语言一样,为了人们交流思想的需要,文字一般有表音(读、说)和表形(看)两个功能,其最终目的是表义。通过这一信息载体,无论说或看都能对同一概念同一事物获得相同的信息。因此表义的好坏和效率是衡量文字功能优劣的主要标志。从这个基点出发,对文字的基本要求是表义的简明性和书写的简洁性。1.表义的简明性现代汉字是由象形符号逐渐演变进化而形成的,它以特定涵义的方块造形来表现一定的事物及概念,并便于词义自身的发生和发展。构成汉字的每一个部件往往具有表义或表音的功能,可帮助人们理解和记忆其涵义。例如“鱼”(fish)是生活在水中的一类椎脊动物的总称。从汉字的字形上就表达出了它的基本属性。如:鲫(crucian carp)、鲭(mackerel)、鳜(mandarin fish)、鲨(shark)、鲑(salmon)、鲟(sturgeon)……这些汉字(也是单字术语)的某一部件表示涵义(鱼),另一部件表示读音。从字形上可以反映出命名术语的科学性和系统性,达到顾名思义的效果,并且可以打破地域和时域的限制,无论广东音、福建音、普通话……只要看到字,理解都是相同的。与相对应的英文相比,这些汉字在表形、表音、表义、简短、方便理解和记忆等方面都有十分明显的优越性。正如一位日本专家所说:“汉字的信息量大,它本身就是一种集成电路”。[2]“表义正确,一词一义”是人们对文字及术语的另一要求,汉字发展中也体现了这一要求。例如“cell”一词在英文中是多义词,汉语术语按不同的专业概念分别定名为细胞(细胞学)、子房(植物)、电池(电子)、电解槽(电工)、小室、单间(建筑)、元件(电子)等等,这些词在各自学科中又派生出一系列组合词。又如“pressure”一词,汉语把垂直作用在物体表面上的力,叫“压力”;把物体单位面积上受到的压力,叫“压强”。这样更能反映概念的内涵,区别概念。2.表达的简洁性汉字的基本单元是具有一定涵义的字(由偏旁、部首组成的“集成块”),表达专门概念的术语由字组成。这种结构上的特点,决定了汉语术语与国外拼音文字术语相比,具有明显的简洁性。据对全国名委公布的《地球物理学名词》和《测绘学名词》的部分术语随机抽样统计,英、汉术语所占二维面积之比为1∶0.6。例如interchain hydrogen bond,“链间氢化”;reading frame displacement,“移码”。所以,汉字是一种简洁、高效的文字,这已逐步为人们所认识。长期以来,有两种观点有必要加以剖析:一曰:英文只需背26个字母就行了,而汉语要掌握几千字,因而汉语难学,这是汉语的一大缺点。笔者认为,把汉字与英文字母相比是不相当的,这是一种片面地、孤立地分析问题的方法。(1)如前所述,既表音又表意的汉字是组成汉语术语的基本元件。相当多的汉字本身就是有特定涵义的单字术语(或词)。此外,汉语的组词习惯是以双音(即二字)构词为主,如对《现代汉语词典》中所收的词作粗略统计,二字词、三字词、四字以上词的词条数之比为5∶1∶0.4。而英语术语的基本构词元件只是表音的字母,有涵义的词(或术语),是由若干字母组合而成的新集合体(集成块)来表达。简单的表示为:汉语:汉字(表意的集成块)→术语(表意的大集成件,包括复合术语)英语:字母(非表意的符号元件)→术语(表意集成块)→复合术语(组合集成件)这种差异直接影响两种类型文字的简洁性和易记忆性。可见汉字与英文字母在术语中的作用是完全不相当的。(2)汉语的常用字比较集中。据测算,使用频度为0.15‰。以上的汉字仅1000个左右;使用频度在1‰以上的汉字仅为250左右[3]。就是说,掌握1千个常用的汉字,就能进行一般简单阅读(1万字中只约有1个多字不认识)。通常认为,英语需掌握三千条词汇左右才能进行一般阅读。这里没有对记一千汉字与记三千条英语单词的难易程度作比较,但从绝对数字看,汉语的常用字仅为英语常用词的1/3(本文未考虑语法问题)。(3)汉语词与英语词的构词单元不同的事实还决定了汉语的记忆和鉴别单元比英文少。例如,进行阅读和校对时,英语需要按每个字母扫描,而汉语是按集成块扫描。很明显,绝大多数相同含义的词(术语)所包含的英文字母数比汉字数多得多。香港著名人士、全国政协副主席安子介先生曾说“汉字是沿着逻辑的轨迹演变出来的”[4]。汉语术语是这种汉字逻辑轨迹在科技概念方面的延伸。科技术语的命名,要求做到系统性,用汉字命名科技术语恰好能发挥汉字逻辑演变的特点,强化科技术语的系统性。例如风(wind)按强弱分为:静风(calm),软风(light air),轻风(light breeze),微风(gentle breeze),和风(moderate breeze),清劲风(fresh breeze),强风(strong breeze),疾风(near gale),大风(gale),烈风(strong gale),狂风(storm),暴风(violent storm),飓风(hurricane)。汉语的这种逻辑演变的结果,有利于发挥人的逻辑思维能力和理解能力,大大提高记忆效率。二曰:汉字难写,英文好写。英文等拉丁语系的文种便于书写,而方块形的汉字(由各种笔划组成)书写有一定的困难,但实际上,以词(术语)或句子形式出现时,两者的书写时间比较接近。特别是在长约近一个世纪的英文“打字机时代”(机械化手段),由26个字母组成的英文发挥了明显的优势,汉字打字机无法与之相比。进入二十世纪80年代,计算机技术迅猛发展,人类已进入了信息化时代,在这场变革中,我国科学家出色地解决了汉字信息化处理的问题,取得了卓越的成果,对汉字(汉语)作出了划时代的贡献,并将在智能化方面不断开拓,使打字机时代曾被湮没了的汉字光辉重新释放了出来。汉字书写的一部分功能也将会发展出新的方式。一些作家、记者、知识界人士纷纷“换笔”(以微机代替笔写),人们从伏案爬格子的状态中解脱出来的时期不会太远了。这是立足于当今新时代对汉字发展的认识。我们要丢掉“汉字落后”的偏见,从新认识汉字,并努力开展汉字现代化、信息化研究。二、汉字不仅属于中国汉字是中华民族对世界文化的一大贡献。世界上有拉丁文化圈,也有汉字文化圈。中国、日本、朝鲜的语言是三种不同的语言,然而,由于历史的、地理的原因,中国汉字、日本汉字、朝鲜汉字同属一类文种:a)中、日、朝汉字都是表义文字;b)这些汉字的基本笔形相同(如—| 、 );基本构件相同或相似,c)据有关专家统计,中日汉字字形完全相同或具有微小差别的占50%以上[5]。汉字在新加坡、马来西亚等一些东南亚国家也有很大影响。近年来,还有一些国家掀起了“汉语热”,学习汉语的人越来越多。随着现代科学技术及我国经济、文化的发展,汉字文化的优越性将愈加为国内外人士所认识。因此,汉字不仅属于中国,她也是亚洲人民的宝贵文化遗产,她还是世界人民的共同财富。中国作为汉字文化的大本营,应为提高汉字科技术语的质量作出更多地努力。我们全国自然科学名词审定委员会,正在严格、系统地审定统一我国的科技术语,并已取得相当大的成绩,这是对汉字文化圈的贡献,受到越来越多的各国华人的赞扬。我们应该加快发展与东南亚各国,台、港、澳等地区及世界其它国家的华人科学家的广泛联系,共同作好汉字科技术语的命名与统一工作,使汉字术语在继承和发扬汉语文化方面作出新的贡献。三、汉字术语的命名要发扬汉字的长处由于历史的、国情的等多种原因,我国新的科学概念,绝大多数是从国外引进的。这些概念在中国如何命名,我国学者长期有两种主要观点。一为意译,即用汉字表达出概念的基本特征。二为音译,即使用与外文读音相近的汉字表示。笔者认为,汉语术语命名应主要采取反映概念内涵的表意形式,也就是意译。这是因为:1.术语的基本功能是便于人们交流科学概念术语的定名应做到好懂、好记。按科学概念订名有助于人们直接理解概念的内涵。例如,“ergonomics”一词若按音译,订为“厄戈诺米克斯”或半音半意定为“尔刚学”,从译名上不能理解词义。但按科学概念的内涵定为“工效学”,使人们能望文生意,大致了解词义。(经有关专家研究,确定“工效学”的定义为:一门研究人与其所处工作和生活环境之间的相互关系,以适应人体解剖学、生理学、心理学要求,从而达到提高工作效率和安全、健康、舒适为目的的学科(自动化名词审定委员会,《自动化名词》,1990)。又如“watchdog”一词,有人从英文名直译为“看门狗”,用字欠雅,甚至会产生误解,这也是一种不以科学内涵命名概念的形式。这是一个计算机、自动化学科的术语,是指一种监视某一状态在预定期间内是否出现的装置。当发生不正常的状态时,该装置可以发出警报。此装置的另一个译名“监控器”,科学地反映了概念的内涵,获得了望文生意的效果,是一个值得推广的译名。2.用表义的汉字组成表义的术语简短、明了由于外文主要是拼音文字,且音节较多,在翻译时,只把汉字做为外文的音(音节)的符号,必然既长又不好记,丧失了汉语表义的特点。例如,日本在二次世界大战后进行文字改革,认为汉字笔划过多,书写不便。在引进学术名词时,常用片假名作为音符音译。对此方针,很多学者表示反对,他们认为虽然引进快,但看不懂、听不懂,不能理解外文的涵义,很不方便。3.汉语术语要注意民族化与国际化的结合汉语术语在坚持按意订名的同时,应本着实事求是的精神,注意吸取外国的长处,注意民族化与国际化的结合。譬如某些科学概念用意译定名太繁琐时,可用引进外文缩写或音意结合的方式命名。如“AIDS”订为“艾滋病”(音意结合);又如“Medvedev-Sponheuer-Karnik[intensity]scale”不宜译为“麦德维捷夫—施蓬霍伊尔—卡尔尼克[烈度]表”,可订为“MSK[烈度]表”。在高文化层次的科技术语中,某些术语用这种方式命名其优点是明显的。我国化学家给化学元素命名时,采用借音(外文音)的办法也是成功之例。四、汉字发展中的几个问题1.汉字字数问题汉字容易遵从组字规律造字,这是汉字字数多的原因之一。今后发展中,应注意控制、减少汉字的字数,不能无限制地造新汉字。随着科学技术的发展,各种新概念、新物质的产生将层出不穷,有些人喜欢用造新字来表示。笔者认为,对新的概念一般应以尽量简明的,两字或两字以上的术语命名。例如“船首”、“船尾”不必再造新字“艏”、“艉”;又如“板”字,代表“片状较硬的物体”,没有必要再创造“钣”字来表示金属板。否则,照此发展下去石板、塑料板、复合材料板又如何办呢?2.同义、近义字问题建议对某些易混乱的同义、近义字要逐步合并淘汰,当然这项工作要经过慎重研究。字(词)典等工具书有责任在这方面起引导作用。同义、近义字在学习或应用中往往不好区分,易产生错别字。如:沙—砂,震—振,贮—储,荧—萤,拣—捡,耦—偶等等。3.造新字问题极个别使用频度很高的,由多字词转变为单字词的基础术语时需造新字,在大家实际接受的基础上,可列为正式新字。例如某些学科已广泛使用,或有些专家建议使用的非规范字:“”(有用能)、“”(无用能)、“砼”(混凝土)、“脘”(蛋白质)、“”(牙合)等,对这类汉字,有关部门应进行研究。但总的原则仍是不提倡造新字。经过较长时间,通过大家的努力,我国的汉字及其术语定将更科学、更先进、发挥更大的威力。  相似文献   

3.
对“古文”“古文字”“古汉字”这一组汉字学术语的使用情况进行了分析和辨别,并在此基础之上分别给这几个术语进行了定义,希望能够有助于消除以往的一些错误认识,正确地使用相关术语。在汉字研究中,某些术语的使用目前还存在着同名异实、同实异名、概念交叉等相互纠缠的种种混乱现象。对这些混乱现象进行分析和辨别,将有利于规范使用汉字学术语,厘清某些理论上的模糊认识。以下对“古文”“古文字”与“古汉字”这一组汉字学术语进行简要的辨析,希望能够消除以往的一些错误认识,对正确使用相关术语有所帮助。“古文”“古字”与“古文字”这样的名词在我国古代文献中很早就已出现了。例如,《史记·儒林列传》记载:“孔氏有古文《尚书》,而安国以今文读之,因以起其家。”《汉书·艺文志》云:“鲁共王坏孔子宅……而得古文尚书及礼记、论语、孝经凡数十篇,皆古字也。”《汉书·郊祀志》云:“张敞好古文字。”“古文”是汉字研究中具有悠久历史而又十分重要的一个术语。但“古文”一词的含义从古至今却经历了不小的变化。许慎《说文叙》云:“及宣王太史籀著大篆十五篇,与古文或异。至孔子书六经,左丘明述春秋传,皆以古文,厥意可得而说。”由此可见,许慎是以“古文”来指称早于籀文的古字体的。许慎等古文经学家认为,虽然古文经书的书写时代晚于《史籀篇》,它们所用的字体却早于籀文,因为孔子等人有意用比较古的字体来写经书。许慎等汉代学者对“古文”的看法对后世产生了很大的影响,直到现代,仍有不少学者持此种观点[1-2]。近代以来古汉字学开始兴起,古文早于籀文的说法遭到了怀疑。吴大澂在《说文古籀补》的自序中,根据《说文》古文与周代金文不合的现象,提出了许慎所谓古文实际上是周朝末年文字的看法。他说:“窃谓许氏以壁中书为古文,疑皆周末七国时所作,言语异声,文字异形,非复孔子六经之旧简。虽存篆籀之迹,实多讹伪之形。”陈介祺在为《说文古籀补》写的序里也说:“疑孔壁古经亦周末人传写,……古文则多不似今之古钟鼎。”后来,王国维又根据大量资料断定所谓古文应是战国时代东方国家的文字(参见《观堂集林》卷六、卷七)。近几十年来出土的大量六国文字资料,印证了王国维对古文的看法[3]。从目前来看,学者对“古文”这个概念仍然没有一个十分统一确定的认识。总体来说,主要有以下两种观点:(1)从广义的角度理解“古文”。或指战国以前的古文字[4];或指秦统一文字以前所有的文字[5-7];或指与隶书相对而言的先秦古文字[8-9]。(2)从狭义的角度理解“古文”。或指秦以前写本的书籍中的文字[7];或指战国时的六国文字[10-11];或指以《说文》古文为主,包括诸如石经古文、《汗简》古文等转抄于战国文字的字体[3,5,8];或指流传到汉的战国时人用通行于当时的字体写在简册上的文字[9]。由此可见,人们对“古文”这个术语的理解仍然存在分歧。那么,从名词术语规范使用的角度出发,应当如何给“古文”一词确定一个较为明确而合适的定义呢?笔者认为,对“古文”一词取广义的理解并不太合适。这是因为,首先,从广义的角度理解“古文”实际上源自古代学者的使用习惯。这种使用习惯一方面反映了古人对古代汉字面貌认识上的局限和模糊不清,另一方面也是古人使用术语时,习惯上不太注重名词术语含义的明确化、科学化的一种表现。其次,根据当代学者对“古文”一词使用的实际情况来看,取狭义的理解已经为多数学者所接受,特别是在古汉字学界。那么,“古文”一词的明确含义究竟如何理解呢?显然,作为一个具有特定含义的专用术语,“古文”一词既非仅指“用通行于当时的字体写在简册上的文字”,也不能笼统地说是“秦以前写本的书籍中的文字”。考虑到目前该术语的实际使用情况和多数学者的意见,我们大体上可以这样来理解它:汉字学上对战国时期东方六国所使用汉字的统称,如孔子壁中藏书所用文字,《说文解字》、《三体石经》、《汗简》等收录和使用的“古文”。下面看“古文字”和“古汉字”这两个术语。自汉代学者开始使用“古文字”这个术语以后,它就一直是用来专指“先秦时期古代汉字”。20世纪初叶,随着甲骨文的发现,先秦古汉字的整理和研究掀起了新的热潮,古汉字研究进入了一个新的发展阶段。出于对传统的认同,包括罗振玉、王国维、唐兰等在内的许多著名学者在他们的著作中也习惯性地把先秦古汉字统称作“古文字”。客观地说,这一用法确实影响了很多人,直到现在仍有不少人继续这样使用“古文字”这个术语。从20世纪50年代起,有学者开始用“古汉字”指称人们惯称的“古文字”。例如,蒋善国在《汉字形体学》中曾有这样的表述:“青铜器时代的终结,标志着古汉字的转化。”“汉字的象形面貌,除甲骨文外,只有依靠金文来保存,金、甲文是古汉字的两个宝藏。”姜亮夫曾说:“甲骨文字与部分殷代青铜器上的铭文,这才是现在所知的最古的汉字。从其形体的形式与内容来分析,都可以肯定它们是已经很进步的古汉字。”[12]裘锡圭等许多著名学者在他们的著作中也经常使用“古汉字”一词。比如,他在《文字学概要》一书中曾有这样的表述:“凡是独立形成的文字体系,都是像古汉字、圣书字、楔形文字那样兼用意符和音符的文字。”近年来,“古文字”、“古汉字”这两个术语的使用仍然不够统一和明确,很多人已接受“古汉字”一词,但沿用“古文字”来指称“古汉字”的也还不少,两个术语共同用来指称同一个概念的用例也屡见不鲜。近年来,“古文字”一词用法调整的必要性已引起学术界的注意,一些研究者就如何正确使用这一术语发表了自己的看法。赵诚说:“古代文字可以简称为古文字,当指那些记录、传达各种古代语言的书写符号系统,应该包括埃及象形文字、楔形文字、玛雅文字、甲骨文等等一切古代所使用过的文字。”[13]《语言学百科词典》“古文字”条:“指镂刻在硬物体上和写于软物体上的古老文字。”《中国语言学大辞典》“古文字”条:“广义的古文字指苏美尔楔形文、埃及圣书字、美洲玛雅文等世界范围内的各种古代文字。”笔者认为,从术语使用的理据性来说,用“古文字”这个术语来专门指称“古代的汉字”显然是不恰当的。这是因为,世界上的“文字”有几百种,并不是只有“汉字”一种,而且“古文字”除了“古代汉字”以外,还应当包括其他民族使用的古代文字。人们之所以仍然把“古文字”一词当作“古汉字”来使用,主要还是由于习惯的原因和对传统的遵从。也许有人认为,使用“古文字”来指称先秦古汉字,人们早已习以为常,在汉语中“古文字”一词已被赋予了专指汉字而言的特定含义,因此没有必要改变人们已经习惯了的叫法。其实,这种说法并不能充分说明问题。其理由如下:(1)如果仍用“古文字”来指称“古汉字”,那么必然会遇到这样的问题:如何给“包括古代汉字在内的世界各种古代文字”这个概念命名呢?若称以“古文字”,则必然造成“一个名称,两个概念”的混乱现象;若不称以“古文字”,还有其他更为合适的名称吗?(2)使用“古文字”指称“古汉字”,与人们通常对“文字”这个术语的认识和理解存在冲突,也不符合术语命名力求的系统性原则。(3)术语的科学化和规范化是一门学科走向成熟和发达的重要步骤,从学科建设和发展的高度来看,暂时地牺牲使用上的习惯是必要的,也是值得的。(4)“古汉字”这个术语早已有许多学者使用和提倡,且正为越来越多的人所熟悉和接受。总之,从术语规范的立场出发,笔者建议,用“古文字”专门指称“世界各民族在历史上创制的各种古代书写符号系统”这一概念,它应当包括古汉字、埃及圣书字、苏美尔楔形文字、美洲玛雅文字等一切古代所使用过的文字。为防止术语使用的混乱,应尽量避免用“古文字”来专指“古代汉字”。为进一步明确“古汉字”这个概念,我们首先必须明确它所指的上下限。实际上,古汉字的起点时间,迄今还难以确定,商以前,可称为汉字的原始阶段。其下限年代,过去一般以秦篆为界(包括《说文》小篆)。近年来考古新发现的文字材料表明,隶书的萌芽始于战国期间,直到汉文景之世,它仍然保存了古汉字结构的鲜明特点,所以,古汉字应包括西汉早期的文字材料[14]。因此,“古汉字”这个术语的定义,大体上可以这样描述:中国古代的汉字书写符号系统,包括原始古汉字、甲骨文、金文、战国文字、秦系文字和汉代早期处于隶变过程中的古隶书等。  相似文献   

4.
记得从上个世纪50年代求学时候起,就不时读到语言学家停止造新汉字的呼吁。把这当作汉字规范化的大事。汉字信息处理计算机化以来,汉字开始成为技术标准化关注的对象。现行汉字编码标准基本采取与英文一样的“一字符一码位”方式,造新字就更显得和这种标准格格不入。“停止造新字”看来似乎已是必然趋势。不久前读到石磬先生文(科技术语研究,2001年2期,下称石文)。石文以外行人易懂的方式解释了为什么有这么多化学新造字。读后大有茅塞顿开之感,引起了我的许多思考。我不是语言学家,也不是化学家,只是一个长期从事计算机专业教学的教师,参加过若干中文信息处理方面的工作。现就汉字标准化与化学新造字有关问题发表一些议论。关于化学新造字据苏培成先生文(科技术语研究,1999年3期,下称苏文),从清末江南造船局到1964年,化学新造汉字已达647个。1998年1月化学名词审定委员会又给105~109号元素新造了五个汉字。苏先生正是面对这种无休止造新字的势态发出呼吁的。苏文虽短,但集中反映了语文界的主流观点。这些观点是:“汉字字数繁多,而且数目不定:‘出生不报,死亡不销’。这是造成汉字难学难用的一个主要原因,给我国教育和科技发展带来严重负面影响”。汉字规范化要求四定,“四定首先是定量”。要实现现代汉字定量,就必须停止造新字,不再复活死字。强调“现代汉语词汇有很强的复音化倾向”。大量使用复音词,便可避免造新字。还建议采用汉语拼音转写科技术语。苏文最后呼吁化学家克服习惯势力的阻挠和抵抗,从中国语文现代化大局出发,停止造新字。石文是我读到的第一篇鲜明地正面论述化学新造汉字必要性、合理性、必然性的文章。他用外行人易懂的具体例子说明:“由于化合物的组成复杂,不用新字会使表达它们的新复合词音节变得很长,很难为大家接受”。“造了新字才使以这些新字组合的复音词化学术语简单、科学、合理”。石文认为汉语新词的规律有复音化和多音词缩合化的两向性,只强调复音化是片面的。石文认为,新化合物种类繁多,层出不穷,对于不断出现的化合物母体,不得已造新字,是不可避免的。石文中上述论述十分自信,但其关于造新字“砆”作为fullerenes的汉字名时,则显得颇为犹豫和无奈。关于计算机外字汉字的计算机处理,首先要用二进制数码表示每个汉字。这就是汉字编码。中国现今应用最广的编码标准是GB2312,颁布于1980年,收录了6763个汉字字符(包括少量非字偏旁)。这6763个以外的汉字,对GB2312就叫集外字,简称外字。计算机字库芯片和有关汉字软件都按技术标准批量生产制作。这批量的规模是数万,数十万,数百万……对这批量生产的计算机,外字都是不能使用的,计算机不认识它们。现今汉字应用软件中,为解决外字问题,提供了补字造字软件。用这种软件造字时,由操作员决定给一个外字什么代码,并具体设计其字形。这种外字处理方式是操作者的个体行为。只有造字者使用的计算机才认识这个外字。在网络环境下,外字无法以代码方式在网上传输交流。这就是为什么许多专用汉字系统(由专项经费支持开发的、带有大量自造外字的)无法上网的原因。这种外字处理方式,对单台计算机,对系统内的若干计算机,主要用于排版打字时,有一定使用价值。即使在这种情况下,新造的计算机外字和集内字仍有很大差别。这些差别至少有:①新补造的字,无法受字形控制符控制。现行造字软件通常只能按一种字体设计字形。你造了个宋体字,在排版时,用控制符让它变成楷体或隶书,都是不行的。只有集内字才可以。②新补造的外字,输入法难于和集内字统一,常常只能用区位数码输入。③补造的外字无法与集内字统一排序处理。④最重要的还是这种文件无法以代码方法与其他计算机交换。可见,这种新造的外字仍然是三等公民,是私生子,就有许多麻烦要你处理。为了解决GB2312所收汉字不够用的问题,国家后来又相续颁布过几个大字符集编码,收入汉字两万或更多,但外字问题一直没有解决,反而又增加了一个多编码并存并用,混乱不统一的问题。化学新造汉字,要考虑音义的合理、贴切,常不得不造出个计算机外字。这种外字尽管可以得到许多语言学家的同意,尽管可能获得有关部门领导的承认,但只要不被纳入国家技术标准并明令颁布实施,它就仍然是计算机外字。用现行造字软件新造了它,它也依然是三等公民,是私生子,而汉字编码国家标准的修订又远非那么容易。外字难题的由来仅从具体技术上讲,是由于汉字沿用了或误用了适用于英文的编码方式(一字符一码位)和单纯的线性编辑操作。英文是封闭的小字符集,字符数量少而又明确确定。而汉字是开放性大字符集,字符数量庞大而又字无定数,且有不断的造字需求。按“一字符一码位”方式,只能先编码基本汉字,而后扩充,再扩充。这就自然产生了外字问题。人们手写时没有外字问题,是因为手写时可随时拼组出所需要的汉字。这样拼组则是非线性的叠加操作。英文已积累的大量文字软件中基本上都是线性操作。20多年来外字问题未能很好解决,有许多原因值得分析,有许多教训值得记取,本文无法展开讨论。宏观地或简单地说,这是汉字计算机化处理发展初期,由于进展迅猛和缺少经验,不小心落入了英文之巢窟而难于自拔。回顾汉字问题的历史是有意义的。在农业时代,手工操作是文字处理的主要特征。这期间汉字技术代表了世界先进水平。造纸和印刷术是对世界的巨大贡献。在工业化时代,二三百年中,文字处理技术的主流是机械化。机械打字和以机械打字为收、发端的电报传讯是这个时代最典型最普及的文字工具。汉字在机械化面前,遇到了无法克服的困难。姗姗来迟的汉字机械打字机和汉字四码电报,在与英文的比较中,突出显现了汉字的繁难、笨重、低效,难于普及。这深深刺痛了中国的志士仁人。这个时代又恰巧是中国逐渐沦为半殖民地境遇的时代。救国图强的中国文化人迁怒于汉字,把改革乃至抛弃汉字当作救国之策。上个世纪50年代,新中国成立之同年同月,中国文字改革协会成立,不久,走拼音化道路的主张被提出来。而六七十年代英文成功实现了计算机化处理。此时的汉字肩负着机械化和计算机化的双重重负,艰难、无望、甚是悲凉。直至80年代 ,仍有语言学家断言,计算机是汉字的最终掘墓人。但历史却出人意料,短短的十余年间汉字竟然神奇地实现了计算机化处理。90年代初中国出版印刷业全面告别铅与火,大批作家、记者换笔潮,表明汉字计算机化初步成功。人们开始明白,文字的技术属性优劣,是个历史性概念。汉字的无法真正机械化和汉字能够自动化、智能化都是历史事实。但二三百年的“山穷水尽”和十余年间的“柳暗花明”,毕竟来得太突然。这神奇的发展初期,除少数成果是政府和有关机构计划支持者外,大量的应该说是有志者自主地,乃至即兴地创造。那令人眼花缭乱,无所适从的数百种汉字输入法之涌现,真可以看作是汉字复兴大业之开台锣鼓。汉字计算机外字问题是这迅猛发展中的一个具体失误,又由于技术标准的强制性、稳定性,问题的彻底解决就必然有些麻烦。新世纪,是彻底解决外字问题的时候了计算机网络正在中国迅速普及。网络环境下外字问题显得更为严重。外字无法上网传输。许多花巨资开发的汉字专用系统和相关文献资料成了信息高速路旁的堆积物。外字问题的彻底解决,还将带动其他难题的解决。上个世纪的最后20多年,具汉字功能的计算机实现了从无到有,实现了初步优选和普及。积20多年的技术和经验,是该实现全汉字完整完满解决的时候了。全汉字完整解决方案这里简要通俗地描述一个可以彻底摆脱外字困扰的技术方案。它是真正适用汉字这种开放性大字符集的。它可以统一处理全部汉字。这里的处理,包括编码表示、字形表示、存储、输入、编辑操作及传输。这里的全部汉字包括已知的所有汉字,和那些可能造出而尚未造出的汉字。它同时应该实现繁简体字一体化处理。大陆与港澳台地区繁简体汉字的不同使用,是政治对立隔绝的历史形成的。而计算机化过程中分别采用了不同编码标准则事实上加强了繁简分立,给汉字统一规范制造了新的障碍。全汉字完整解决方案应实现繁简汉字一体化处理,为统一规范的汉字应用提供良好的技术支持。该方案的具体技术要点如下。1.使用综合编码方案。被编码的汉字字符包括3类。a类为常用汉字(包括繁简体,约数千,占实用字次的95%以上)。b类,为除a类外的其他各种可能的构字部件(偏旁、部首、字根之类)。c类为结构类型控制符(三五十左右)。全部编码字符数千足矣。2.在上述第1条的基础上,在传统字处理线性操作基础上,增加拼组汉字功能。对a,b类汉字字符,直接用单一编码表示、调用。对其他汉字使用如下定义式描述:<结构类型符><汉字字符串>。<结构类型符>由单个c类字符充当。<汉字字符串>是a类和b类字符组成的串。计算机软件自动地依定义式拼组成单个汉字。下面举例说明。为便于排版,避免另造外字,下面的例子中暂且用黑体的“刂、二、川”表示左右结构、上下结构、左中右结构。105~107号元素所选用的三个汉字、、可分别表示为字符串:刂金杜,刂金喜,刂金波。105和107号元素名还可以三分表示:川金木土,川金波。这种情况下,一篇文稿的计算机化文本将有两个:a.源文本,其中直接用<结构类型符><汉字字符串>描述未编码汉字。b.目标文本,其中不再出现定义式。定义式由计算机软件自动拼组化为单个汉字。人工手写的文稿,可以直接写成目标文本,也可以使用定义式。使用者个人随意。3.设计统一的输入法。键盘上对c类的结构类型符逐一分配码位。未编码的汉字即外字,输入码一律是结构类型符打头的键盘符号串。4.字形库分永久性字库和动态字库。永久性字库存已编码字符(包括a,b,c3类)的字形信息。动态字库存按定义式拼组生成的字形信息。为了保证拼组字形的高质量,前述b类字符中可能包括同一个部件有显著差异的不同变体。如部件“木”可有上木(森之上部),下木(梨之下部),左木(树之左部),右木(淋之右部)等。按此法安排,前述b类字符的数量将由数百增至二三千。计算机软件只依靠定义式,无需其他信息便可自动选用相应部件,拼组出符合印刷质量的字形(质量稍差,似亦无防大体。拼组字常只占甚小比例)。只要拼组用部件设计了不同字体(宋、黑、楷、隶等),就可以拼组出相应字体的拼组字。此时的外字字体便可按排版软件中字体控制符变化。拼组字库能显著缩小字库所需存储量。为了减少永久性字库消耗,有人把a类常用汉字字形也用拼组方式形成。本人见到过全拼组式的汉字系统,其印字质量和速度均可满足使用需求。5.仿照王竹溪先生在《部首大字典》首先提出和使用的汉字排序法,可以实现内外字的统一排序。王竹溪先生选取数十个部件称为汉字字母,每个汉字都按规则拆分为汉字字母串(该串即汉字之排序码)。再利用英文词典序相同方式给出汉字排序。外字的排序码由软件按定义式自动生成,和已编码字的排序码相似。6.此种系统中,利用源文本文件,使用拼组定义式的外字以及它和编码字符的任意组合,都可以作为检索单元作检索。7.源文本文件可以上网传输。目标文本可以在任意终端上自动拼组生成。上面描述的方案并非只是笔者的空想。自上世纪80年代以来,已有多人以不同方式、不同规模实现过,推出过商品化产品。只是由于多种原因,未能成功,或未能成为主流方式。与强制性的国家现行技术标准(尽管是陷入ASCII巢窟中的)的不一致是导致恶运的重要原因之一。但据知,现今某些排版系统内部,如某日报编辑部与全国多个印刷点之间,便采用本文所描述的定义式方式实现异地外字代码的传输。客观地说,ASCII编码体制以及后来的有关汉字标准,并没有公然地、赤裸裸地否定排斥拼组式操作,甚至一直留有拼组活口。最早的ASCII编码国际标准便提到可以用拼组方式生成带附加符号的字母(如头上带双点的U)。现在看来,这活口是英文给它的同宗小兄弟(使用多种附加符号的欧洲拉丁字母系文字)留下的画饼充饥之画饼、望梅止渴之梅果罢了。后来的汉字有关标准所留拼组的活口,则是给汉字用户留下的画饼和望梅而已。但需知,我们忍耐饥渴,等待真正可食之饼,可食之梅的时候,正是有关利益集团大赢其利的黄金时光呀。再说可行性与困难数学公式、化学反应方程和结构式,乐谱(简谱、五线谱),服装设计图,动画都已成功实现了计算机化处理。其中的非线性叠加拼组操作,无一不比汉字拼组来得复杂多样。各类程序语言和应用软件中,源文件和目标文件的使用已是普遍常规。因而可以相信,上述具拼组功能的全汉字完整处理方案不存在严重技术困难。有人担心,这种系统将给随意滥造汉字提供方便。我想,这不会比现行英文中拼写错更为严重。英文词的打字输入几乎没有限制。英文WORD软件的拼写检查,要在机内存储庞大字典和拼写规则库存。对查出的可能差错以下划绿红线方式提示操作者。前述拼组汉字系统,由于定义式都以结构类型符打头,庞大字典是不需要的,效率只能高,不会更低。有人担心拼写不唯一(如字的二分和三分)会造成检索失误。此类问题不难通过具体规则限制(只要规定最小拆分或最大拆分即可)。至于目标文件视觉长度和源文本不一致则纯属枝节,不足为虑。本人认为主要的困难不在于技术方面,而在于学术思想,管理体制,编码技术标准体制,有关机构、集团的经济利益之权衡和学术领导地位之思虑,等等。另一方面的因素是这种拼组式全汉字系统是否有强烈社会需求。这种社会需求也与广大汉字用户对有关问题的性质、缘由、严重性、解决可能性的认识或知识有关。笔者撰写本文就是想和术语学界、语文学界等有关各界作一沟通交流。如果饥渴尚可忍耐,或饥渴者不众,那便也只有等待了。本文前面提到的拼组式全汉字系统将为汉语文化圈统一规范提供良好的技术支持。把现今被不同编码标准所强化、复杂化了的繁简对立变为繁简一体,混然一炉,使繁简体的使用成为可以由操作者个人选择的平常事。周有光先生在多种场合呼吁,迅速缩小由政治地域等历史原因造成的汉语文不统一(不统一表现为三种汉语文:普通活+简化字的大陆语文,普通话+繁体字的台湾语文,广东话+繁体字的港澳语文)。此项工作需要国家高层决策者的支持。但没有各有关方面专家的理解支持,也不会有国家高层决策者的理解和支持。期待名词委在自己的能力所及发挥积极影响。涉及术语用字的几个具体建议①中国术语数据库已经颇具规模。希望有关专家撰文在本刊报告计算机外字实际使用情况(数量,处理方法等)。②石先生关于造“砆”字的思考中,反映了“停止造新字潮流”给命名用字带来的强大限制。希望专家们考虑,假设有了一个方便可用的拼组式汉字系统时,你想造那些字?这些新字对术语的简单科学合理性贡献如何?结语历史已经表明,汉字有悠久的历史和顽强的生命力,汉字有独特的品格和许多优点。汉字确实无法实现真正的机械化,在与英文机械化的较量中是惨痛的失败者。但计算机技术特别是软件技术,为汉字提供了全新舞台。20多年的实践证明汉字对信息化、智能化新技术有极好的适应性。现存的汉字处理中的难题(外字的问题或不能完整表达问题,排序问题,输入法优选问题,字库庞大问题,多编码并存混乱问题,汉字计算机操作训练与汉字基础教育脱节甚至矛盾的问题,……)都不是不可克服的。其中许多问题,恰恰是盲目追随ASCII之误导才造成的。我相信,新世纪汉字的完整、完满的解决方案终将实现。  相似文献   

5.
语言文字是人们在社会活动中交流思想的工具,是人类进入文明时代的标志。为了使用和推广规范汉字,我国政府以及各有关单位和部门先后颁布了多项规定,如《第一批异体字整理表》(1955年)、《简化字总表》(1986年)、《现代汉语通用字表》(1988年)、《出版物汉字使用管理规定》(1992年)等。为了适应现代科学技术的发展和国际间科学技术交流的需要,科技名词也应该规范化和统一。为此全国科学技术名词审定委员会(简称“全国名词委”)已公布了数十个学科的规范科技名词。规范汉字和规范科技名词均具有权威性,我们都应该按照要求,认真使用。但是,在规范科技名词的使用中,我们发现个别规范汉字与规范科技名词之间存在某些矛盾。如全国名词委公布的《人体解剖学名词》中的“内眦”用了异体字“眥”。上书“趾”中的“”字和《医学名词》(第4册)中“癫”的“”字,在《现代汉语通用字表》中都没有收录。有的权威性工具书中的科技名词也不规范。如《现代汉语词典》(修订本)还在推荐使用“植物性神经”(正确的应叫“自主神经”)等不规范科技名词。尽管这些问题不是很多,还是应该引起重视,给以认真对待和分析,并尽快合理解决。在此,我们谈几点看法。一、从事规范科技名词工作的人员应熟悉有关语文知识在不影响科学概念和内涵的前提下,科技名词的规范化完全应该执行我国政府和有关单位、部门颁布的各项有关语言文字规定,服从和统一于规范汉字。但是,全国名词委公布的《人体解剖学名词》用了“内眥”,其“眥”字为30多年前已经淘汰的异体字,显然应该改为“内眦”。[1]像这样的差错可能反映了参加审定规范科技名词的个别专家和编校人员对有关的语文知识还不够精通,因而未能正确使用。规范汉字是所有科技编辑及从事术语工作的专家必须掌握的基本功,有了非常扎实的基本功,才可能在工作中尽量减少差错。另外,在审定规范科技名词中如能聘请语文方面的专家参加某些环节的工作,可能有利于更加严格地把好文字关,确保其高质量和高水平。二、规范科技名词应与规范汉字的调整保持一致1988年公布的《现代汉语通用字表》将15个过去作为异体字的改为规范汉字,其中包括“骼”和“黏”字。那么,相关的科技名词应作相应更改。某些权威性工具书如《辞海》、《中国医学百科全书·解剖学》及《中国医学百科全书·生理学》中使用的“骨胳”,今后完全应该改用“骨骼”。《人体解剖学名词》就是用的“骨骼”。[2]由于《第一批异体字整理表》将“黏”作为异体字,故过去在表达“黏”的概念时均用“粘”(nián)字代替,常用的如“粘膜”、“粘液”等。既然“黏”字已成为规范汉字,现在该用“黏”字表达的科技名词就不应该再用“粘”字了。[3]“粘”字有2个读音(nián和zhān)、4个义项,若再以“粘”代替“黏”字,不仅名不符义,易造成概念混淆,而且读音也感到很不方便。所以,现今沿用的“粘膜”、“粘液”均应修改为“黏膜”、“黏液”,以与规范汉字保持统一。此外,对同一生物组织结构,全国名词委公布的《生理学名词》订名为“髓袢”,而《组织学名词》却订名为“髓襻”。按《现代汉语词典》,“袢”同“襻”。既然如此,上述两个学科应协商共同选用其中的一个名词。[4]三、汉字规范化也要适应科学技术的不断发展现代科学技术的发展突飞猛进,新事物、新概念、新名词不断涌现。汉语在科技名词的创造上具有极大的潜力,它能表达深刻的哲理性思想,反映和传播各种精细微妙的知识。由于有关规范汉字的若干规定多数是10~30年前制定的,在当时的历史和文化背景下,规范汉字在组构和表达科技名词方面,难免与目前有不协调或欠妥当之处。如神经病学名词“癫痫”与“癫”的应用问题,“”(jiān)与“痫”(xián)字读音不同,但两者的释义无大的区别。50年代及60年代初期,多数医学专业书采用“癫”,以后又多用“癫痫”。但人们的口语中一直习惯使用“癫”。1995年,全国名词委神经病学名词审定组根据有关专家的意见,经过反复慎重的研究,将“癫”作为规范名词,使其文字读音与口语相一致。又如“趾”与“拇指”为两个不同概念的名词,在人体解剖结构中“”属足部,“拇”为手部。在《辞海》、《汉语大词典》、《汉语大字典》中均收有“”字;《中国大百科全书·现代医学》及《中国医学百科全书·解剖学)中分别录用“趾”及“拇指”作为两个名词;全国名词委公布的《人体解剖学名词》也分别有“趾”与“拇指”,还列出“长屈肌”和“拇长屈肌”等对应的肌肉名词。可见,“趾”与“拇指”是结构、功能和概念都不相同的两个名词,绝不能混为一谈。但是,《现代汉语通用字表》未收录“”和“”字,甚至计算机汉语字库中也没有“”、“”字,使规范汉字和规范科技名词的使用中又产生了矛盾。因此我们认为,随着现代科学技术的飞速发展,《现代汉语通用字表》也应不断作适当的增补和修改,以适应各种特殊情况,有利于规范汉字与规范科技名词更好地协调和统一。四、权威性工具书应带头使用规范科技名词我们在查阅权威性工具书时,发现其中有不少科技名词不规范。仍以《现代汉语词典》(修订本)为例。该书是1996年出版的,其中的“蹠骨”应为“跖骨”;该书将规范名词“自主神经”作为不推荐使用的名词,而相应的不规范名词“植物性神经”却作为词目;在“神经系统”的释文中用了“神经原”这一不规范名词,这里的“原”应该是“元”;它还将完全不同概念的“毛细管”与“毛细血管”两个名词混为一谈,更是不应该了。权威性工具书代表了我国的文化和学术水平,其社会影响极为广泛,在推广使用规范科技名词方面理应率先垂范,语言文字类工具书在涉及到科技名词时也应如此。《辞海》(1999年版)在修订时对科技词条进行了严格把关。先由从事该领域工作的有相当造诣的专家撰稿,再经过复审,最后由分科副主编,即该领域里既精通业务知识又擅长文字的权威三审,从而保证了高质量,也使科技名词规范化做得较好。这一做法值得推广。  相似文献   

6.
编者按:苏培成教授的这篇文章提出了对汉语造新字问题的意见。这个问题,以及汉字规范化的问题在术语命名中常常涉及,本刊下期将讨论的化学用字读音和“癫”与“癫痫”的问题等都与此有关。造字问题涉及各学科专业人员、语言文字学界以及汉字信息处理等多方面,过去这些方面交流研讨太少。本刊欢迎各方人士共同探讨这个问题,互相交流,共同寻找更好的解决办法。汉字字数繁多,而且数目不定:“出生不报,死亡不销”。这是造成汉字难学难用的一个主要原因,给我国教育和科技的发展带来了严重的负面影响。为了减轻汉字学习和使用的困难,应该实现汉字的规范化和标准化,具体说就是要实现汉字的“四定”:定量,定形,定音,定序。四定首先是定量,只有实现了定量才谈得上实现其他三定。定量就是要确定记录现代汉语所需要的单字数(字种数)。要实现现代汉字的定量,就必须停止造新字,不再复活死字。在这个基础上,再想办法逐步限制和减少汉字的字数,使得通用汉字的字数保持在合理的水平。已故的语文改革家刘泽先先生曾经说过“造新字的方法是绝对要不得的”[1],这个意见值得重视。随着社会的发展,汉语的词汇也在不断地增加,其中包括外来词的吸收。不断增加的新词,对丰富和发展汉语的词汇具有积极的意义。新词的增加并不意味着一定要增加新字,我们要努力做到增加新词而不增加新字。怎么样才能做到这一点呢?现代汉语词汇有很强的复音化倾向,绝大多数的新词是用原有的构词成分组成的复音词。例如“电灯、电话、电车、电视”是新词,其中的“电、灯、话、车、视”都是原有的构词成分,记录这些构词成分的字也是原有的,不是新造的。近百年来,汉语增加了一些单音词,其中有些是外来词。记录这些单音词,主要使用已有的字,同时也新造了一些字。例如“打(dozen)”、“听(tin)”、“盾”(荷兰、越南的货币单位),是让原有的字增加了新的职务;“泵(pump)”、“啤(beer)”、“吨(ton)”,是新造的字。因此,我们大体上可以说,复音词可以不增加新字,而单音词有时要增加新字。此外,因为汉语的音节数目有限,新造字差不多都有同音字。许多同音字用眼睛看可以分得清,靠耳朵听却分不清,如作为姓氏的“张”和“章”。靠目治,不靠耳治,这和传声时代的要求背道而驰。这是新造字的又一个缺陷。为了不增加新字,就要提倡多用复音词,尽量避免单音词,而近百年化学名词发展的传统似乎并不是这样,而是尽量使用单音词。清末江南制造局翻译外国科技书籍时就开始为元素名称造新字,到了20世纪又为有机化学名词造新字。例如,把“养气”、“轻气”、“淡气”叫做“氧”、“氢”、“氮”,把“白金”叫做“铂”,把“白铅”叫做“锌”。既然用了单音词,又不喜欢使用假借字,就只得造新字。化学用字在汉字新造字中占有相当的比例,给人们留下了深刻的印象。60年代有人统计,近百年来新造的化学字多达647个[2]。这次为105~109号元素造新字,走的还是一百多年前江南制造局的老路。请化学家考虑:考虑新的化学元素能不能不用单音词?这样做会遇到什么困难?有没有解决的办法?除此之外,还有没有别的路可走呢?语言学家早就提出来用汉语拼音转写国外的科技术语,包括化学上的术语,代替汉字的音译术语。例如“锿”改为Einsteini,“钔”改为Mendelevi,“镑”改为Lawrenci。周有光先生指出:“如果这个目的能够达到,我国科技术语的面貌将焕然一新,科技的发展将由于术语的革新而得到方便。”[3]拼音转写已经提倡了许多年,可是至今还没有被采用。是理论上还有不妥之处,还是习惯势力在阻挠,还是两者兼而有之?总之,如果我们从促进中国语文现代化这个大局来考虑,就应该把不造新字这个原则肯定下来。新的解决办法总能找到的。或者实现术语的复音化,或者采用拼音转写,不管采用哪种办法都会遇到习惯势力的抵抗。其实,习惯是可以改变的,有时也是必须改变的,这就要全面衡量利弊得失。除了上面说的以外,还有没有别的办法呢?这要听取大家的意见了。  相似文献   

7.
一、科技术语的汉字学基础汉字、汉语是世界上最悠久的古老文明的瑰宝,是东方灿烂文化的象征,这一优秀文字善于表达深邃的哲理概念。远在春秋战国时代诸子百家的著述与论坛中留下了精辟记载;善于表达或发掘深沉细腻的情感,历代诗词歌赋中,蕴藏着生动的蓄意和叙情;善于记述和传播精确微妙的知识内容,浩如湮海的古籍中记载有大量而丰富的古代科学技术知识,显示着中国古代学者们创造性思维的科学内涵。根据西安附近发掘西周古都镐京出土文物判定,中国文字始于黄帝时代(距今4500-5000年)〔1〕。关于汉字起源与演变的研究,有着光荣的传统,早已成为一门独立的学问。古代称之为“小学”,清代末称之为“文字学”;新中国成立后的50年代称之为“汉字学”。其分类有历史汉字学、现代汉字学以及外族汉字学三大类。现代汉字学主要研究汉字学系列、汉语、汉字的形、音、义,汉字计量、汉字电子计算机技术与编码,传声技术以及汉字的信息值等〔2〕。现代科技术语虽然系应用术语学的独立分支,而从学科体系来说,应归属于现代汉字学系列之中。这就是说,研究我国科技术语,包括翻译活动中的术语创译法,都要建立在汉字学的基本知识之上,确切反映所指事物内涵,才能做到信、达、雅的高标准。这正是我国术语及其翻译的优良传统所在。众所周知,相当一部分科技术语源于翻译活动,我国翻译活动,最早始于西周,秦代出期现了最早的翻译机构——译场〔3〕;汉代佛经传入中国,翻译事业大兴。桓灵之世就有著名翻译家安世高、支,东吴的支谦、西晋的竺法护等〔4〕都可说是精通古汉语,几乎都可称之为六朝的文学大家〔4〕;唐代达到繁盛时期,以玄奘(602-664)之《大唐西域记》为代表。他们训释清晰,用字巧妙,充分反映出所指概念的内涵,达到比较高超的翻译水平。明代徐光启(1562-1633)在翻译《几何原本》时,以他文采素质,根据原文含意,释订出反映数学的一套汉字数学名词,至今尚在沿用,诸如:点、线、面、直角、钝角、锐角、多边形、四边形等;此外,李之藻(1565-1670)、徐寿(1818-1884),李善兰(1810-1882),华蘅芳(1823-1902)等〔5〕,他们在天文学、数学、物理学、化学、地质学,以及应用科学方面,以他们高超的中国古汉语、古文字学的素养,按照汉语、汉字的规律和特点,借助外国汉学家的口述(他们之中,几乎都不懂外语),确切地译定出我国早期,表达古代科学内涵的科技术语,有许多术语还是创译而延续至今。试举几个例子,以作探讨。“化学”一词的翻译,据科学史专家们的考证〔6〕,最早源于阿拉伯语al-kimiya,而语源却从中国炼金术传入,演变而成,阿拉伯语kim,从读音上很接近中国金字,al是阿拉伯语的冠词,因此,把al-kimiya,作为“金液学”,其语源来自中国金丹术衍生而成。中国炼金术通过阿拉伯传入欧洲,逐渐转化欧洲语词Al-chimy,衍生法语Chimie,德语Chimie,英语Chemistry。1.关于“化学”一词的翻译和使用,早有袁翰青〔7〕教授、潘吉星教授〔6〕专文讨论,最早是在18世纪中叶,从欧洲,以译音方式传入,当时译为“舍密”,像1788年出版的《葛氏舍密》,1827年出版的《苏氏舍密》,而最有影响的要算是1857年出版的《舍密开宗》。而“化学”一词的翻译和使用据考证:大约在1857年英国汉学家伟烈力亚(Wylie Alexander,1815-1887)主编《六合丛谈》中正式使用,在这以前,英词传教士韦廉臣(Williamson,Alexander,1829-1890),在编纂《格物探原)中,曾试译汉语“化学”一词。相继才有《化学分原》(1872)《化学指南》(1873),到傅兰雅(John Fryer,1839-1928)和徐寿(1818-1884)翻译出版《化学鉴原》才更为普遍使用“化学”一词。过去一段时间内,国内有些学者误认为“化学”一词是由日本转译而来,这是应予以纠正的,从1967年日本学者坂口正男发表的《关于“舍密开宗”的化学命名法》一文中,明确地表明“化学”一词是由中国传入日本。2.“地质”一词也有同样的误传,众所周知欧洲文字“Geology”一词,最早来自于古希腊,中世纪的拉丁文为geologiam,欧洲文艺复兴时演变为geologia,都不是现代地质学的概念,18世纪出版的《英语词典》(1755年)中解释为“地球的总学说,地球的状态和性质的知识”;1779年瑞士学者索修尔(Horace Benedct de Saussure,1740-1799)在《阿尔卑斯山旅行记》一书中,首次使用“geology”一词来表达近代地质学的科学概念〔8〕。而汉字“地质”一词,据李鄂荣教授的考证〔9〕,认为是1852年英国伦敦会教士慕维廉(Muichead William,1822-1900),用汉文撰字的《地理全志》上,正式使用和创译。《地理全志》共为上下两编,下编第一卷,即为“地质论”,其中“地质志”一节,即为阐述地质学近代概念的篇章。文中写道:“察地之土分文、质、政三等……,所谓质者,即地质之意,系地球之形质、以至盘石……,地层的层系及其中所载生物草木之遗迹,海底之变迁等”。这之前都以地学,金石等代表地质学概念。一直到新中国成立后,地质界一般都认为,汉字“地质”一词,源于1903年鲁迅以索子笔名发表的《中国地质略论》为来源,由于当时鲁迅是在日本留学,故而认为是从日本转译而来;1983年日本弘文堂出版的《科学技术史事典》中,“地质学”条目中,仍说:“把geology译为“地质学”是日本人箕作阮甫所创,这是应该纠正的;70年代末,一个日本代表团访华时,在一次有中国地质学史专家参加的座谈会上,一位日本学者曾表明汉字‘地质’一词是从中国引进,在1859年日本引进了《地理全志》一书,同时提及该书下编之“地质论”之“地质志”一节,并说该书对日本明治维新时期,传播地质学知识起过启蒙作用。3.“植物”一词,古籍中早有出现,而代表近代植物学概念的术语,要首推1847年李善兰和韦廉臣编译的《植物学》〔10〕,这本书是很据英国植物学家林德莱(John Lindley,1799-1865)著《植物学纲要》(Element of Botany),最早把“Botany”创译为“植物学”。1867年才在日本翻刻,1875年译成日文,为日本所采用。在这以前日本学者将“Botanica”译成植学,诸如宇田川榕1835年发表的《植学启原》,1870年的《植学译签》以及1875年小野职悫的《植学浅解》等,在日本也有的学者把Botanica按音释译成“勃太尼加”,诸如1922年宇田川榕庵译成“菩多尼词经”〔11〕。4.“物理”一词,我国在公元前2世纪《淮南子·览冥训》中就出现有“物理”一词,文中说:“夫燧之取火于日,慈石引铁,蟹之败漆,葵之乡(向)日,虽有明智,弗能然也。故耳目之察,不足以分物理,心意之论,不足以定是非”。晋代(265-420年)杨泉曾有《物理论》,宋代理学家朱熹(1130-1200)常以“物之至理”而论,明末清初方以智(1611-1671年)有《物理小识》一书;明代哲学家王阳明(1471-1528年)有格物致知之说,清代格致学,有包含物理学、化学之概括;1623年意大利传教士艾儒略(Jules·Aleni,1582-1649年)撰写《西学凡》一书时,把Physics,按音译译成汉语“费西伽”直到1900年才正式创译“物理学”一词〔12〕。值得提及的是1868年建立了江南制造局的翻译馆,这在中国翻译史,特别是科技翻译史上占据重要地位,据资料统计该馆从1868-1909年共翻译西方科技图书176种,创译了大量科技术语,广泛地传播了西方近代自然科学知识〔5〕。甲午战争后,清代学者掀起戊戌变法,研究西学形成热潮,维新派以严复(1853-1921年)为代表的一批学者,在翻译西方论著,引进西方科学技术上起了重要桥梁作用。严复翻译的《天演论》并创译了一批科技术语,给科技翻译建立起信、达、雅的原则,成为科技翻译的典范,至今仍奉为经典,广泛使用,对中国科学技术的发展起了不可磨灭作用。辛亥革命前后,在科学救国、工业救国的思潮中,科技翻译活动日趋增多,包括自然科学、社会科学以及实用科学各个领域,科技术语也就日趋增多。老一辈科学家汉字学知识丰富、深邃,根据汉字的规律和特点,创译了一大批令人信服的科技术语,促进了国内外的学术交流,也为我国科学技术的发展起了启蒙与桥梁作用〔3.5〕。根据中国科技发展的特点,许多近代科学技术知识、概念,相当一部分是通过翻译引进而来,科技术语的审定,包括了翻译活动在内,从某种意义上说,中国科技术语审定的历史,也是科技翻译活动中的发展历史。新中国成立不久,国家十分重视科技术语的规范与统一,在1950年初成立了学术名词统一工作委员会,截至60年代,已公布、出版各学科名词术语百余种,这在国内外学术交流中,享有较高的声誉,同时,也为新中国科学技术的发展,国内外进行学术交流创造了前题。1981-1985年国务院批准了国家科委、中国科学院关于成立全国自然科学名词审定委员会的报告,并任命了著名原子能物理学家钱三强为主任委员,其任务是:“确定工作方针,拟订全国自然科学名词统一工作计划实施方案和步骤;负责审定自然科学各学科名词术语的统一名称,并予以公布施行。”现已成立各学科名词审定委员会40余个,并审定出版、公布各学科名词术语20余部。促进了国内外的学术交流,通过几年的艰苦的工作,在以汉语为基础的科技术语审定方面,建立起具有独特汉字系统的术语审定、翻译、命名的原则和方法,丰富了应用术语学的理论基础,为建立以汉字为特征的术语学体系做出了努力〔13〕。新中国成立之后,坚持运用以汉字学、汉语语音学知识来命名、审定物理学名词的学者,应首推北京大学王竹溪教授,他根据汉字表意、表形的特点,汲取汉字、汉语的精华,几十年如一日审定、翻译了令人赞赏的大量物理学名词,成为我国老一辈科学家掌握汉字、汉语知识的典范。把物理学名词译为汉语,这除了要准确表达物理学内容,还要符合汉语的表达习惯,使大家易懂、易读、易记。在一些第三世界国家至今不能用本民族语言讲授物理学,相比之下,我国科学家把科学名词一一译成汉语并最后加以审定,实在是对中国科学的一大贡献,也是对汉语的一大贡献〔14〕。诸如“激光(laser)、衍射(diffraction)”等。显示出汉字表形、表意、指事、会意的特点,真使人“望文生意”。做到了根据事物本质特征及属性,从概念做出术语的定义,反映出代表所指事物的内涵概念和外延的综合。二、汉字、汉语及其术语的强大生命力随着我国经济实力的日趋增长,科学技术现代化的发展,在当今世界的地位和影响,特别是在21世纪经济发展集团化的趋势下,亚洲经济圈、东北亚经济圈、东南亚经济圈正在形成过程中,严格来说这个地区共同文化遗产——汉字,将会显示出更强大的威力。全世界有文字的语言约150种〔15〕,其中有12种主要语言,占总人口的60%。根据语言谱系分析,现在地球上使用汉字、汉语的人口约为14亿之众,占世界54亿人口的26%,形成了广阔的汉语地区,有的学者称之为汉字文化圈,几乎与世界英语圈15亿人相当〔16〕。汉字也是唯一保存象形文字演化系列的文字系统,经历过甲骨文、金文、小篆、隶、楷的演化过程,具有6000-7000年的悠久历史。就是当代世界经济走向集团化的21世纪,汉字汉语同样更是璀璨辉煌、更具强大生命力。1991年在北京召开的“汉字是科学、易学、智能型国际性的优秀文字”学术座谈会上〔17〕,许多学者、知名人士发表的激动人心的讲演中,对汉字、汉语在世界上地位和影响,做了崇高的估价和远见卓识的展望。1.香港知名人士、著名语言文字学家安子介先生说:“汉字是汉文化的根,是中国的第五大发明”;同时在他受聘担任港事顾问前夕,他提出的第一条建言,“香港应当提倡学习中国的普通话。具有中华民族文化传统的汉字,可以增强民族的凝聚力和认同感〔18〕。2.汉字现代化研究所、北京晓园语文与文化科技研究所,以及汉字汉语学家袁晓园教授在会上宣称:“21世纪将是汉语、汉字发挥威力的时代”〔19〕。3.全国政协副主席、著名科学家钱伟长教授说:“以前有人认为计算机是汉字、汉语的掘墓者、汉字是中国现代化的障碍,我们用自己的力量,汉字不仅输入计算机,而且速度比拉丁字母快”〔19〕。事实正像钱伟长教授所指,近年来从500多种汉字编码设计方案中,反映出汉字具有传递信息量大的特点,解决了汉字不能进入计算机的危机;事实表明,计算机汉字编码技术的应用,给科技术语检索,以及术语数据库的建立创造了优越的先决条件。(1)杭州大学外语系吴洁敏教授的突破性的成就——汉语节奏规律提出了系统地论证。他认为:“汉语节奏周期的三种组合模式——往复型、四环型和对立型”,并总结归纳出汉语有“音顿律、长短律、重轻律等7种节奏形式,认为“在一个语言链上套叠的节奏层次越多,形式越丰富,则声音越美”〔20〕。(2)美国加利福尼亚州大学物理学教授程贞一提出:“汉字、汉语特别适应于声音与计算机联络,因为汉字是单声调语言,比拼音语言中声段更具保真能力,语言信号可迅速地进行频谱分析;汉字形象千姿百态,具方形矩阵空间,蕴含各种不同的信息密度,有利于技术上模拟形辨别,进行信息输入与检索;汉字的逻辑结合与现代科学逻辑如出一辙,它在字形组合与构成科技术语和表达科技思想方面,具有多向发展的蘖生能力和无限的表现能力;在方法的选择上,可采用拼音法、拼形法、代码法等多种方法,加上汉字词汇没有形态变化,更适宜调汇编码,输入速率极高”〔21〕。实事证明:计算机的出现和应用,不仅没有酿成汉字、汉语的衰落,汉字编码的优势,有力地否定了所谓“掘墓者”的论断。恰恰相反,拥有占世界四分之一强人口的汉字、汉语文化圈,更显着汉文化瑰宝的强大生命力,及其对世界文化圈的影响。汉字计算机编码的发明,是汉字和现代电子学结合的创举,许多专家说,“汉字进入信息时代,其意义不亚于古代印刷术的发明”。在这次国际性的优秀文字学术座谈会上,人大常委员会副委员长、著名学者费孝通、雷洁琼、张友渔等参加了会议。会上日本石井勋博士以他三十年从教的实践,得出:日本幼儿用日语学习汉字“较日文假名易学”、“愈早学习汉字效果愈佳”的结论。在会上还披露:一部反映汉字科学性的《神奇的汉字》专题电视片(四集)已拍摄完成。此外,为了推动全国汉语汉字的理论研究,进一步阐述汉语汉字的发展趋势和特点,由晓园语文与文化科技研究所和汉字现代化研究会在首都北京共同召开“汉语、汉字学术讨论会(1992.8.7-1992.8.9)。来自国内外83位专家学者就两大论题进行了热烈地讨论〔22〕:第一,关于汉语汉字特点的基本理论向题主要有:汉语与汉字的关系,汉语的功能,汉字的功能以及汉字的价值量问题;第二,关于汉字的发展前途主要包括:汉字发展的科学化,汉字规范化、标准化、汉字的心理、历史、政治等多学科研究,以及汉字的卫生学问题。众所周知,汉字是世界上唯一保存下来的表意性优秀文字,历史最悠久,是建立在标识原理(logographic principle)之上。汉字本身形象如画,形意融合,可从直观形体上把握符号所标识的概念意义,可以说是以形见意,能诱发刺激人的思维,产生意念,更易激发其人的情趣,产生创造性思维;加之有象可征,有意可寻;易于形成人类认识过程的符号集群,给人提供完整认识事物、辨别事物,以及认识世界的建构模式〔23〕。中国科技术语自古以来,都是用来正确标识科学技术以及生产、生活各种概念的符号集群,显示着古代科学家的创造性思维产物,具有明显的专业性、科学性、简明性和系统性。可以说,反映中国科技概念的术语,早已有了独特的体系,形成了一整套严密的命名原则与方法。早在春秋战国时期,墨家就明确提出:“名来源于物,名可以从不同方面和不同深度反映物给出定义”。对圆、方、平、直、端都给出内涵定义。中国科技术语的结构,主要是按照汉字、汉语的规律构成,体现出了汉字、汉语表意性的特点。大部分术语都是由单音节或双音节构成,简明扼要,而蓄意深切。汉字、汉语一词一字都能确切地反映出所指事物概念的分化原则,从形、声、意方面都能清晰地分辨出一事物与他事物的不同和差异,表达出事物各自的特征和专属性。但也应该认识到,汉字有难认、难记、难写、难读的弱点,尤其是对西方人来说,方块字及读四声确实难度很大,在普及上有一定局限,进而也影响了国际上的文化和学术交流。根据最近语音学家和语言学家以及术语学家的研究,发现汉字单音节、方块形体,是直观性文字,有人提出过于直观,影响人们认识过程的思维深化。汉字编码,由于缺乏系统而深入的理论研究,在编码的方法上尚无统一规范和标准,呈现有一定混乱现象,值得有关部门加以管理〔24〕。尽管如此,从全世界不断持续高涨学汉语的热潮这个侧面,充分反映出汉字、汉语的强大生命力。据1988年台湾《光华》杂志刊载陈雅玲文章《东风吹遍世界——全球学华语热》〔25〕这份材料统计:目前在全世界非华裔人口中,正在学中文的学生已超过10万人,设有中文课程的国家有60多个,其中巴黎第三大学的中文系共有学生1800名,是世界上最大、系统学习汉语的专门机构;当时的联邦德国约2000名大学生申请学习中文;从1985-1986年两年翻了两番,从4所大学开设中文课程增加到20余所;日本大阪外语学院中文系入学分数,远远超过英文系,一段时间内,日本学习汉文、汉语的热潮一浪高过一浪,甚至大批知识界以喜爱汉字书法为高雅嗜好;美国设有中文课的高中约有130所,大学则有486所,像俄亥俄州立大学中文系,也是全美最大的学系。美国学华语热可从1972年尼克松访华开始,形成第一波浪潮,卡特政府与中国建立正式外交关系,使这股热潮掀起第二波,有200所高等学校创办汉语学专业,或中文系,进修汉语学生达1.3万人;1993年中美首脑西雅图会晤,预计将掀起这股热潮的第三波浪。加拿大近年来特别注重中文教育,其实是看中与太平洋盆地的中国大陆、台湾和香港地区以及新加坡等发展贸易;夏威夷大学东亚语文系教授李英哲说:纽约的许多犹太人,不惜昂贵的学费进修中文,认为这对未来自己的事业会有助益。世界“汉语热”在1990年8月在北京召开的第二届国际汉语教学讨论会上反映出更新的趋势〔26〕。据不完全统计,全世界已有60多国、1000多所各类学校创办了汉语课或中文系。美国纽约教育局决定从1992年开始,将汉语列为所有初中、高中和大学正式教授的第二种外国语;美国还成立有“中国语文教师协会”并创办有专门学报,显示美国的汉语教师队伍的力量。日本在校学生中上汉语课的约有10万人,日本广播协会举办汉语教学节目已有20年历史,通过电视、广播等形式学习汉语者可达百万之众。新加坡把汉语定为官方使用的语言之一,大力推广汉语。1986年成立了“华文教学研究会”,推广华语教学;政府还专门成立有标准汉语教学委员会,并决定从幼儿园开始就进行汉语教学〔26〕。我国为适应世界“汉语热”,前两年的资料表明,已在60多所高等院校专为外国留学生开设汉语教学课程,进行汉文化教学。根据韩国《中央日报》1992年8月28日报导:“韩国大学中文系门庭若市,企业争聘中文人才”,三星和金星企业招聘人才,懂汉语为第一个条件。现时,除建国大学中文系外,其它单科大学也有许多学生进修中文课程;该报1993年10月25日发表成均馆大学李大垠教授专文《汉字是东北亚经济圈的重要因素》〔16〕中提及“现在在地球上使用汉字的人口,大约有14亿人”,他在文中提出质疑说:“只使用谚文(韩文)能够充实我们的文字生活吗?……能够继承我们的传统文化吗?……能够进行专门学问研究吗?从我的专业(经济学)来看,我想强调指出,在我们文字生活中,只用谚文是不行的。”文中最后说:“不久前,我们几位教授自动地组织了‘鼓励使用汉字教授会’。我们认为,现在专用谚文的趋势不仅使国民甚至使大学生也会成为汉字文盲。这样就难以进行专门研究和高水平教育,所以我们希望首先在大学掀起使用汉字的新风”。总之,随着亚洲太平洋经济合作组织的形成,亚洲经济圈、东南亚、东北亚经济圈的发展以及我国经济实力的增强和现代化的魅力,将不断激发着“汉语热潮”一浪高过一浪。三、两岸科技术语的统一趋势我国是汉字、汉语,以及汉文化的发祥地,如果说,现在地球上使用汉字人口为14亿的话,我国就占11亿,还有我国台湾以及香港、澳门地区,在汉字文化圈内占据着重要地位。汉字、汉语的标准化,尤其是科技术语的翻译和统一,更是举足轻重。因而,首先必须是两岸同宗同源的汉字、汉语的规范化和统一化,才能发挥汉字、汉语以及汉文化的强大生命力。由于历史上的原因,两岸术语,特别是翻译引进的术语缺乏相互交流,译法不同,诺如association,在遗传学上我们大陆译为联合,而台湾则译为配对,interference,大陆译为干涉,台湾译作干扰,outbreeding,大陆译为杂交繁殖,台湾则译为异交,restitution,大陆译为重建,台湾则译为复合作用等,大家已熟知的激光与雷射,计算机与电脑,硬盘与硬碟等,可以说是不胜枚举。值得庆幸的是,随着海峡两岸交往日趋频繁,两岸学者对术语翻译及统一、交流已以不同方式开展了合作与研究:1.1991年6月初台湾省电脑公会联合会理事长林宣宏,接受福建省计算机学会的邀请,在参加第三届“全国”文学处理研讨会期间,已与该省“信息中心”达成共识,计划建立两岸电脑术语对照表,促进两岸信息交流中术语的统一〔27〕。双方在讨论中,碓认为两岸电脑术语,在翻译成汉语时很不相同,诸如computer,台湾译成电脑,大陆译作计算机,台湾译为硬碟,大陆则译为硬盘,台湾的印表机,大陆则译成打印机,记忆容量单位大陆译为兆,台湾直接用两字首的英文字母缩写成M.K,因而在两岸信息交流和学术交流中造成语言障碍,故双方决定:首先对两岸常用计算机(电脑)术语制成对照表,创造条件进行讨论,达到统一〔27〕。2.1991年8月份海峡两岸汉字学家在北京人民大会堂召开了海峡两岸汉字学术交流会,会上有40余学者报名发言,其内容涉及两岸汉字研究现状和主要成果,中国文字的历史及其发展规律;汉字的整理与汉字量化研究,汉字的独特书法艺术,汉字教学及汉字信息处理等方面的问题〔28〕。3.1992年11月中央研究院院长吴大猷教授邀请以张存浩教授为首的7位大陆著名科学家访问台湾,以及他本人的访问大陆,开辟了相隔40余年两岸学者间的相互交流与“学术对话”,在彼此访问期间,都发现两岸在“学术对话”和交流中涉及术语上的差别,特别是翻译汉字的不同,影响交流。像《台湾联合报》1992年6月11日报导说:“来访的7位大陆科学家分别与台湾的同行展开‘学术对话’〔29〕。学者们表示,在科学上虽然两岸隔离40年,有些科学名词两岸不同,但科学还是最共通的语言”。该报报导华中一代表在介绍大陆发展的分子电子材料时说:两岸电子学的汉字译名有很大的不同,像台湾的“积体电路”,在大陆为“集成电路”,这是因为在两岸不交流的三四十年,正是电子学发展最快的时期,以致译名各行其是;相对地,那时物理学的变化较少,所以两岸在这方面的专业名词就比较接近。4.1992年7月2日台湾“文建会”通过了推动研究两岸文字统一与加强文化资产保存发扬工作的五年计划,先着重两岸用语、译名、字形、音译等调查研究,再经由两岸文化交流而讨论彼此差异,寻求统一方案”〔30〕(台湾联合报)。5.1992年8月31日海峡两岸学者,在北京科学会堂共同研讨术语学与术语标准化,籍以统一专业术语,弘扬民族文化。两岸学者共同认为,当前两岸使用的术语有相当部分不相同,或完全不相同,这给两岸学术交流造成颇大不便,特别影响了相互的信息和学术思想的交流,故而引起两岸学者们的高度重视。讨论中,两岸学者共同希望,积极开展汉字规范化、标准化的研究,促进两岸学者的合作,拟订两岸术语交流、协调与统一计划,使汉字术语系统早日规范化、标准化,扩大汉字、汉语地区,以及国际术语标准化的影响,弘扬中华民族的灿烂文化〔31〕。6.1993年举行了“汪辜会谈”〔31〕,在发表共同协议中提出了“探讨海峡两岸科技名词的统一”问题,全国名词委作为对口单位,应责无旁贷地承担起这个历史重任。7.“汪辜会谈”共同协议公布后,全国自然科学名词审定委员会所属各学科分委员会通过不同渠道,开展广泛联系。诸如1993年11月两岸的物理学名词审定委员会主任赵凯华(北京大学教授)、王亢沛(台湾大学教授)共同研讨两岸物理学名词时,提出两岸物理学名词“约有20%是不同的,不少是科学家译名上的差异。”最后商定“准备海峡两岸双方和香港地区,邀请新加坡、马来西亚的华人物理学家共同研究、讨论,为统一物理学名词而努力。这碓是一个良好的开端〔32〕。由此表明,当前汉字、汉语,及以其为特征的科技术语的研讨与统一、协调,不仅反映出了海峡两岸、港澳学人的多年愿望,现已成为中华民族统一大业的组成部分。只有尽快地协调统一、规范化,才能使汉字、汉语以及科技术语翻译,在亚洲文化圈、汉字文化圈起到应起的重要作用,并为建立以汉字为特征的现代应用术语学体系做出贡献。  相似文献   

8.
同属汉字文化圈的中国与日本长期发生语汇互动。近代以来,日本创制的译介西方术语的“新汉语”大量传入中国,构成中国汲纳西方文化的语文工具。日制“新汉语”主要借用并引申汉字古典词对译西洋术语,也借助汉字词构词法创制新词对译西洋术语。不少日制“新汉语”已经成为汉语词库的通用成员。  相似文献   

9.
摘要 英源性字母词与英源性原语词的最大不同,应该以是否汉语语音化且被权威汉语词典收录来区分。从汉语词汇对英源性字母词及原语词的吸纳来看,字母词及原语词的大量渗透不会动摇汉语的基础,只会改变汉语吸收外来语须汉字化的单一模式,使汉语的书写方式呈较为多样性的特点,从而客观上丰富了汉语语言的表达。不过,其最后的去留,宜由汉语汰劣存良的发展规律决定。
英源性外来词,特别是字母词的大量出现,已成为当代汉语词汇系统演变中最突出的现象。20世纪90年代末,某些形似字母词的英语单词,以小写字母书写形式及标准英语读音,直接进入汉语。有关议论言及的多属词汇系统表层性的问题。其实,对全球化下汉语词汇如此醒目的新变化,完全有理由提出更为深层的问题,如这些英语单词是否会受到汉语的浸润而被逐渐接纳为汉语词汇?汉语是否可能由此引发牵筋动骨的变化?如果会的话,又将如何?这便是本文关心的问题。一、 英源性字母词笔者现已收集到近20年来出版的18种新词语词典,最早的为1987年版《汉语新词词典》,最新的为2001年版《新华词典》。18种新词语词典,共收录新词语5万余条,856条为字母词、音译词、意译词构成的英源性外来词,其中,英文字母共319个,它们或独用或与汉字夹用,如CT、DNA、GDP、WTO、OK或IT业、ST板块、K线图、H股、IP卡等,这些大写的英语首字母缩略语就是“字母词”。另外,极少数的英语单词因使用率高、使用范围广,特别是读音已汉语拼音化,也被作为特例归入字母词,如Internet和E-mail。英源性字母词之所以能被权威词典接纳,主要具备了以下语言条件:1.语音条件。字母词字形虽未汉字化,却在读音上呈汉语语音化的趋势。如E读作“yī”,J读作“jiè”,C读作“xī”或“sèi”,U读作“yóu”,W读作“dǎbūliū”,T读作“tì”,O读作“òu”。 E-mail读作“ yī mèir”,IP卡读作“āipì卡”。此类读音是约定俗成的。2.语素条件。字母词实际上就是一个复音语素,而复音语素为中国人所喜闻乐见。3.语法条件。字母词多为名词,基本为一词一义,使用频率高而专,表达意义单一。在汉语语法中,名词是可以替代的,基本不改变句子结构。二、英源性原语词但是,18部字典没有一部收录某些媒体所常用的既未汉字化更未汉语语音化的英语单词。然而这种英语单词原语照抄现象又确实存在于汉语语篇,不得不引起关注。在归纳的基础上,笔者将此类英语单词暂名为原语词汇[1]。为区别于字母词,对原语词试界说如下:1.原语词不属于字母词。字母词主要由英语首字母缩略而成,且已汉语语音化,并被权威汉语词典正式收录。而英源性原语词,读音不仅未经汉语语音化,目前还未被汉语词典收录。2.原语词与汉语语言规则存在矛盾。一方面有汉语自身的原因,如汉字字形的表意性与小写字母字形及字义,很难产生吻合;一方面是字母文字的原因,如表音太强,表音过程的拼合性过于明显,不可能与汉语某个具体意义建立稳定的对应关系;一方面则是由于汉语对原语词使用的随机性。因此可以说,原语词是未被汉化的非规范词。3.原语词汇的存在形式以语码混用为主。所谓语码混用,指将语码A插入语码B,但语码B仍处主导地位,而被插入的语码A则处于从属、补充地位,不得作为完整的句子单位独立发挥作用[2],但可作句子成分之用,其意义需按语境确定,如:(1)R&B和Hip-hop也由此成为了主流音乐形式。(《金陵晚报》 2003年 11月26日C13)(2)Hi,大家好!(少年科学月刊《哥白尼》 2003年12月24页)(3)看到论题的fans就可以酷言酷语地大侃你的观点了,在这儿还可以用你最帅最靓的笔名哟!(《哥白尼》 2003年12月38页)可以肯定,英源性原语词不属英源性字母词,其存在主要是人们求新求异的心理使然[2]。三、 汉语词汇对英源性字母词及原语词的吸纳英语作为汉语外来词的最大来源由来已久,但英源性字母词的有增无减以及英源性原语词的出现,则从一个侧面说明外来新观念、新认识正源源不断地充实着人们的头脑,因而不可避免地对汉语词汇演变形成巨大冲击。汉语总会在大量筛选的基础上,容纳一些最重要、最常用、最基本的字母词与原语词,使它们以一定的方式凝固、沉淀下来。(一)汉语对英源性字母词的吸纳汉语源源不断地吸纳新的英源性字母词作为单独的词使用。如GDP是一个三音节的字母词,在“从前GDP增长率一公布就‘驷马难追’的传统做法将得到改变”中,就作为单个词使用,充当一句子成分。至于汉语吸收字母词的方式,似可概括为:1.不将字母词汉字化。汉语文字形式选择是字母词难以汉字化的重要因素。2.扩大字母词汇量。汉语对字母词的吸纳集中于金融市场、国际关系等方面。3.汉语语音将进一步同化字母词的发音。4.以字母为书写形式的汉语拼音缩略词将增多。随着中国国际地位的提高,汉语的影响日益重要,汉语拼音缩略词将会以“出口转内销”等方式大量涌现,如GB(Guo Biao国标)、RMB(Ren Min Bi人民币)、HSK(Hanyu Shuiping Kaoshi汉语水平考试)等。(二)汉语对英源性原语词的汰劣存良英源性原语词与英源性字母词最大的不同就在于是否“汉语语音化”。在追踪研读语料的基础上,笔者认为汉语对原语词的吸收呈以下方式:1.汉字化。将个别常用原语词汉字化,其过程为:异化发音→复音或单音音素汉字的出现。首先,按汉字的发音习惯,对原语语音进行异化处理,然后将其汉字化,甚至语素化。例如近几年十分火爆的原语词cool,就已经历了cool→酷→酷哥、玩酷、酷毙了、酷美体这一从异化发音到汉字化直至单音语素化的转化过程。2.合法化。提取极个别英源性原语词,归入字母词,因为此类词使用频率高、范畴广、读音汉语语音化,如已被归为字母词的E-mail。3.淘汰与保留。绝大部分英源性原语词从讲求原汁原味,到游移于汉语权威词典之外,直至销声匿迹,过程相对短暂。一方面是因为新概念贬值迅速,时尚潮流脚步太快;另一方面,是因为有关部门加速了统一译名的步伐和工作,如《科技术语研究》杂志就以译名统一为宗旨,开辟了“名词工作论坛”、“公布科技名词”、“热点词难点词纵横谈”、“两岸词苑”、“术语学研究”等栏目,在翻译外来词汇和统一译名方面做了大量工作;最重要的是,在很多人眼里,英源性原语词夹杂在方方正正的汉字中间,有损于汉语文字的工整美、汉语读音的韵律美、汉语文化的内涵美。在上述种种因素的作用下,汉语将淘汰绝大多数原语词,仅保留少数发音简短、书写简易的常用原语词,如Hi,Bye等。不过笔者认为,英源性原语词就像“不识句读”的古汉语加入了英式标点符号那样,其书写形式、读音方式未必不能助于创建汉语文字之新的形式美及内涵美!(三)汉语词汇系统的发展对于英源性原语词的出现及英源性字母词的增多,社会各界虽认识不一,但态度总体而言是宽容的。这使得原语词及字母词不仅频繁出没于媒体,也常见于普通中国人的日常交往中。在进一步研究英源性字母词及原语词在汉语中的运行规律,深入学习汉语语言史之后,笔者认为现代汉语中的这一新现象不可能危及汉语文字的生存和发展:首先,字母词和原语词并非脱离于特定语言环境能够独立存在的语义实体。一般而言,离开句子和语境,离散的单词或词组对人类思想交流的作用极其有限,因为人类思维活动与实践活动是非常微妙复杂的,其描述远非单词或词组所能独力胜任!其次,英源性原语词在汉语词汇中的存在只是点缀,绝不会出现占据较大篇幅的现象,因而难使汉语沦为所谓的“大杂烩”,加之汉语自身强大的同化能力、发展能力、吐故纳新能力,不可能面临对原语词“不译则亡”的危险。英源性字母词和原语词对汉语词汇系统的渗透不仅无损于汉语的发展,还改变了汉语吸收外来语须汉字化的单一模式,使汉语的书写方式呈汉字与字母大、小写并用的多样性倾向,从而客观上丰富了汉语书写方式及词汇表达,同时还反映出全球化大环境下社会的飞跃发展、各国间往来的更为频繁、新事物的不断涌现及人们认识的不断深化。不过,现代汉语中的这一显著变化是否值得推广应用,宜由汉语演变规律决定。注释: *本课题受到河海大学“科技创新基金”和江苏省教育厅哲学社会科学基金的资助。①18部新词语词典为:《现代汉语词典》,中国社会科学院语言研究所,商务印书馆,1996。《汉语新词词典》,闵家骥等,上海辞书出版社,1987。《现代汉语新词词典》,王均熙等,齐鲁书社,1987。《新词新语词典》,李行健等,语文出版社,1985。《汉语新词新语新义词典》,诸丞亮等,现代工人出版社,1990。《新词新义词典》,雷良启等,湖北教育出版社,1991。《新语词大词典》,韩明安,黑龙江出版社,1991。《汉语新词语》,于根元,北京语言学出版社,1991。《新词新语词典》,李行健,语文出版社,1993。《汉语新词语》,于根元,北京语言出版社,1993。《汉语新词语》,于根元,北京语言出版社,1996。《现代汉语新词词典》,于根元,北京语言出版社,1994。《汉语新词典》,刘一玲,北京语言出版社,1994。《现代汉语词典》,商务印书馆,1996。《汉语新词新语年编》,宋子然,四川人民出版社,1997。《当代汉语简缩语词典》,刘一玲,四川人民出版社,1998。《现代汉语新词语词典》,林伦伦等,花城出版社,2000。《新华词典》,商务印书馆,2001。  相似文献   

10.
同属汉字文化圈的中国与日本长期发生语汇互动。近代以来,日本创制的译介西方术语的“新汉语”大量传入中国,构成中国汲纳西方文化的语文工具。日制“新汉语”主要借用并引申汉字古典词对译西洋术语,也借助汉字词构词法创制新词对译西洋术语。不少日制“新汉语”已经成为汉语词库的通用成员。  相似文献   

11.
三十六字注音法,传承“反切”开新花;三六0字直音法,依此读音准不差。 “36字注音法”是笔者在2009年完成的,《人民日报海外版》曾专门介绍。该方法的特点是:只用36个字就可将汉语的全部音节表注出来。在此基础上筛选出360字并编成歌诀,可用“直音法”标注3600余字之音,为实现“汉语最好学”的目标开辟了一条新路。据此开发的输入法和学习法,将在汉语教学中发挥更大威力。  相似文献   

12.
我国的术语命名问题,特别是自然科学的术语命名问题,有很大的特殊性。特殊在哪里?主要因为我们使用着方块汉字,而且使用的历史已经相当长。我们虽然有了汉语拼音字母,但是它在社会上还很不普及,远远没有具备正式文的资格,只能算一种辅助工具。这一点和日本的情况大不相同,日本的假名字母カナ已经成为文字的组成部分。因为使用方块汉字,我们的语言和文字常常容易闹“分家”。在给术语命名的时候,我们不但需要考虑语言问题,而且还要考虑文字问题。从过去自然科学术语命名的情况来看,似乎考虑文字方面比较多,而考虑语言方面比较少。大家知道,汉字是一种注重“目治”的文字,只要眼睛能够看得懂就算满意,至于耳朵能不能听懂可以不管。理想的术语命名,应该是眼睛既能看得清楚(“目治”),同时耳朵也能听得明白(“耳治”)。当然这里所说的看得懂和听得懂,都是对“内行”(懂专业的人)而言的。为什么要提出以上两方面的要求呢?现在是所谓“信息时代”,传声技术越来越发展,也越来越显得重要。最近报导,FMB中文语词处理机(简称“拼音电脑”)已经研制成功。这种电脑,用汉语拼音输入,自动转变汉字,效率很高。预计明年可以大批生产。现在已经在着手考虑“声控电脑”。既然可以用汉语拼音输入,再进一步就直接用语音输入,转变汉字,效率当然更高,使用也更方便了。从未来发展看,搞人工智能,搞“机器人”,用语言来发出指令比用文字来发指令当然更为方便实用。这些事实迫使我们在考虑名词术语的时候,不能单从文字的角度出发,还要多从语言的角度出发,即是说我们的名词术语不但要利于“目治”,更要利于“耳治”。这样语、文兼顾,对未来的发展才更为有利。从以上的要求出发来看我国自然科学名词术语的制定,是有不够理想的地方。亡羊补牢,犹未为晚,这里想从语言文字的角度,对今后自然科学名词术语的命名问题,提供一些参考意见,不妥当之处,望大家指正。1.不再新造汉字现在汉字的数量已经不小。《新华字典》原来收字8000多个,后来改版增加为11,000多个。到底要多少汉字才够用,谁也说不清楚。汉字字无定量,给信息处理等各方面带来不少麻烦。多少年来人们就想摸一个底,给汉字定一个“量”,但始终未能实现。原因之一,就是不断有新字产生。从汉字的发展历史来看,早在秦始皇统一汉字的时候,甚至还要早一点,汉字就已经由“造字”为主的阶段转为基本上以“造词”为主的阶段。但是,“造字”之风始终盛行不衰。从语言学的观点来看,汉字的“字”基本上相当于外语的“语素”(morpheme)。根据我的研究,汉语大约有4800多个语素(包括单音词和单音词素),而英语也只有4000多个语素。(英语科技词素只有1200个左右,根据W.E.Flood《科技词汇》一书序言说,医药学和解剖学只用了150个标准词素,加上人体各部分名称可以构造出30,000以上的专业词语。)英语用4000多个语素可以造出一切的名词术语,我们用4800多个语素(只需4000多个汉字)同样可以造出一切名词术语。即是说,我们尽可以用已有的语素(字)创造新词,而不必去创造新的语素(字)。可惜由于我们使用汉字的习惯太深,我国的科学术语(主要表现在自然科学)没有彻底走上“造词”的道路。近代新造的汉字当中,恐怕以科技界新造的字为最多。据不完全统计,大约不下200个,其中金字旁的82个,口字旁的20个,月字旁17个,石字旁15个,气字旁13个,酉字旁14个,艹字头9个,火字旁7个,其它类型的有一、二十个。绝大部分是化学家造的,因此有人把化学家叫做新的“仓颉”。化学用字中有机化学造的一批新字,最为古怪,难读难记。如“羟”(qiǎng),“羧”(suō),羰(tāng),巯(qiú)……翻开药物手册,许多又长又怪的西药名称如“苯乙哌啶酮”、“羟哌氯丙嗪”、“苄氟噻嗪”、“氢溴酸氨乙基异硫脲溴”等等,令人望而生畏。相比之下,中药、中成药的名称却易读易记得多,如“乌鸡白凤丸”、“黄连上清丸”,等等。究其原因,中药走了“造词”的道路,而没有走“造字”的道路。今后,能不能不再造新字呢,这个问题,可以研究。去年(1983年)12月,全国自然科学名词审定委员会召开“无机元素命名原则座谈会”,原来打算给3个新元素创造3个新字“”、“”、“”,后来终于放弃了改称106号、107号、109号元素,坚持了不造新字的原则,这是一个很好的开端。2.不用古字和生僻字有的同志认为,新造字没有社会基础,不易为大家接受,于是引经据典,在《说文解字》、《康熙字典》中去寻找古字,让已经死了的字“复活”。他们认为这样做是“古为今用”,有根有据,不会有什么弊病。其实,复活一个古字(死字),等于造一个新字,用数学术语来说,两者“等价”。因为对于一般群众来讲,学习一个古字就是学习一个新字;对于设备来讲,增加一个古字就等于增加一个新字。随便举数学名词的几个例子。“幂”(Power),古义当“覆盖”讲,是一个已经死了的字,群众掌握很困难。“幂”完全可以用“乘方”代替,五次幂就说五次方,幂函数就说乘方函数,幂集就说乘方集,为什么不行呢?“阈”(念“域”)也是一个古字,意义是“门槛”,英语叫threshold,不如译为界限、门限、限度更好,“阈值”就叫“临界值”。“阈”、“域”两个词在数学中都很常用,意义各不相同,二者极易产生同音混淆,很不方便。“正敧斜性”(positive skewness,见英汉数学词汇174页),为什么偏偏要用一个十分生僻的“敧”(qī,期)字呢?完全可以改为“正偏斜性”。这些同志是不是有点儿“好古”。如果大家都这样好古,汉字的数量就没法控制。其结果是自己给自己找麻烦。我认为,今后在科技用字上(其他用字当然也一样)最好规定一个范围。这个范围有多大,是6000多字还是8000多字,总要有个框框,可以由各专业界来协商确定。有了一个公认的范围,事情就好办了,计算机方便,排版印刷打字也方便,工作效率可以大大提高。汉字的数量从无限到有限,从不确定到确定,这是文字改革的一项重要工作。数论上求高次不定方程的整数解时,常常先求出它的上界,然后撒网捕鱼,这就是近代有名的Baker方法。这个方法对我们是一种很好的启示。3.创新术语尽量少用单音词,多用双音词。单音词就是一个字的词,双音词就是两个字的词。古代汉语以单音词为主,而现代汉语双音词占了绝对优势。为什么会有这种发展趋势呢?道理很简单,因为现代汉语只有1200多个音节,为了表达清楚、减少同音混淆,不得不由以单音组词为主变成以双音组词为主。据我的计算,创造一个新的术语,如果是单音词,则与现有词汇产生同音混淆的概率约为0.92;如果是双音词,则产生同音混淆的概率不到0.03;如果是三音词,则产生同音混淆的概率不到0.00001(十万分之一)。前面提到,为了适应今后传声技术的发展需要,在创造新的术语时不但应考虑到文字,更重要的是应考虑到语言。具体说,术语不但要便于“目治”,更要便于“耳治”。天文学上的88个星座,如大熊、狮子、猎人、仙女、长蛇、乌鸦、飞马等等,都用双音词,通俗易懂,听起来清楚,记起来好记,可以算作范例。如果统统改用单音词,效果就要大大降低。我想,在同一个专业范围内,至少在同一个分支学科内,应该尽量避免同音混淆,尽量把某些听不清楚的单音词改用双音词。“阈”、“域”同音混淆前面已经提到过了,“阈”最好改为“界限”。又如矩阵的秩,这个“秩”字是不容易听懂的。因为“秩”字在现代汉语里从来不单用,只用在“秩序”这个双音词里。“秩”(rank)不如译作“等级”、“级别”等,更为通俗易懂。rank correlation叫做等级相关,ranked data叫做分级数据。何必再来一个生僻难懂的“秩”呢?有的单音节词,虽然声调不同,但是听起来还是很容易混淆,比如化学名词中的:氢(qīng)、氰(qíng) 睛(jīng)、肼(jǐng) 磷(lín)、膦(1ìn) 氨(ān)、铵(ǎn)、胺(àn) 铱(yī)、钇(yǐ)、镱(yì)作为科学术语来说,从语言的角度看,并不理想。最后顺便谈谈术语的音译问题。我觉得术语音译,应适当提倡,不应排斥。它的优点是符合国际术语统一的发展方向。根据过去的经验,音译兼意译(这里所谓兼意译,只是意思大体能扯得上),最受欢迎。最典型的例子是“俱乐部”(club)、雷达(radar)等。哪种音译词容易被接受,哪种音译词不容易被接受,它的规律值得研究。数学中也不乏音译词成功的例子,老的如“几何”(geometry),新的如“拓扑”(topology)都被大家接受了。音译词同样也能派生新词语,如“拓扑学”、“拓扑空间”、“拓扑变换”,等等。如果我们将来使用拉丁化的拼音文字,估计音译术语会成为发展的主流。另一个问题是欧美的人名、地名,最伤脑筋。大数学家Euler,一会儿是欧拉,一会儿是尤拉,一会儿又成了尤勒,常常弄得人莫名其妙。特别是一些不著名的人物或地点,更叫人伤透脑筋。一般科技工作者都熟悉一点外文,因此,我建议今后的科技书刊以至科普读物,凡是欧美的人名、地名,一律用原文书写,不必译成汉字。华罗庚同志在四十年代写的《数论导引》就是用的这个办法。近年来出版的《古今数学思想》(四卷)也一律采用这个办法,很受欢迎。不妨先在科技界里试用,然后逐步推广到《光明日报》、《人民日报》上去。如果能够成功,确实是一件大好事情。  相似文献   

13.
存在与无限     
本文是一种尝试:结合汉语文字的博大深邃、简明扼要、一字千钧与英文的灵活细腻、严谨周全、长于诠释论证的特质,用汉语写成的命题连串起来,构成本文的总论断;随附每一个命题的英文解说,则构成对该命题及其中概念的诠释和论证。英文论证所需要的文献,亦引用于其中。本文毋需以摘要贯首,选读中文部分,大意便可一览无余。本文以金岳霖先生的《论道》为典范,在该书绪论中,金先生谈及他本来写作均用英文,后来才尝试着用中文写作,以满足国人学习哲学的需要。如今,国内哲学社会科学领域的学生及学者,英文水平已经很高,正是利用汉语和英文各自的优势,达到弘扬汉语文字,兼顾详尽诠释与严谨论证的大好时代。本文正是在此思路下的一种尝试。探索以汉语为主,英文为辅的哲学写作路径。  相似文献   

14.
科技名词是科技发展和交流的载体,带有时代的信息,铭刻着文化观念,反映着科研成果,是人类科学知识在语言中的结晶。第111号元素(Rg)的中文名“”的诞生,是科学家和语言学家精心研磨的结果,是科学思想和汉语文化交互融合的产物。给新元素定中文名,是一项复杂且有难度的审定工作。专家们充分考虑国际纯粹与应用化学联合会(IUPAC)的命名法则,以及我国化学界通行已久的命名原则和传统做法,一丝不苟、谨慎细致地推敲,最后一致同意选用“”字作为第111号元素的中文名称。“”字不仅与元素发现者的姓名谐音,而且“”字偏旁“金”也反映出了元素的金属性质,这正符合术语学的系统性基本原则。不仅如此,“”字所对应的繁体字“”即为表示一种金属元素的古字,使用类推简化的“”字,字义天然吻合,有利于汉语文化圈内的信息交流。第111号元素(Rg)的中文定名,是专家们科学精神和严谨作风的一次充分展现。科学精神是求真求是的精神,它表现出的是一种理性、客观和缜密。专家们将科技名词审定工作作为重要的科学研究工作,始终贯穿着科学精神和严谨作风。可以说,全国科技名词委公布的、凝聚着专家们的心血和汗水的科技名词,其权威性正来自于这种科学和严谨。第111号元素中文定名一事,再次说明我国的科技名词统一工作具有自身的独特性。我国有着独特的语言文字,汉语文化博大精深,可供表意的词汇丰富。但是,由于汉字不是拼音文字,不能像印欧语系各国之间那样,在引进科技名词时采用字符转写的方式即可。而我国的科技名词统一工作,只能是依靠和发挥博大精深的汉语文化,按照科技的概念和内涵,创造和规范出符合科技规律和汉语文字结构特点的科技名词。我国科技名词审定工作是实践和提升我国术语学理论的大舞台,通过总结、丰富和升华,相信在不久的将来,具有中国特色的汉语术语学理论将会在自然科学与人文科学融汇契合的基础上孕育、产生和发展起来。本刊编辑部  相似文献   

15.
如何以汉字拼音正确表达我国论作人名的问题非常重要。国家语委过去制定的几个相关件颁布以后,中国人姓名的拼写有了规矩,但仍不能适应献录和计算机信息检索的要求。为了规范数据库中重要检索和评价项目的数据格式,提高检索和数据处理的效率,我们制订了《中国学术期刊(光盘版)检索与评价数据规范(试行)》。该规范对汉语姓名拼写法作了变通处理。执行以来已取得了巨大的成绩。建议国家语言字工作委员会采取措施,尽快对原国家标准做出适当修订。  相似文献   

16.
一、前言长期以来,特别是近百年来,我国许多学者创立和翻译了大量科技术语。特别是新中国成立后,在党和政府关怀下,许多有志于我国科技术语事业的科学家、翻译家、教育家、语言学家、编辑学家和术语学家、发扬前辈学者“一名之立,旬月踟蹰”精神,为建立和完善我国科技术语事业,呕心沥血地继续创立、翻译和修订了大量科技术语,并对汉语科技术语领域进行了多方面的探讨,为建立中国汉字系统的科技术语学奠定了基础[1-46]。汉语科技术的总数量,难能确切定出。因为它决定于统计的范围和深度,也由于随着科学技术的不断发展,新学科、新术语不断涌现,有些老的术语需要淘汰或更新,所以要确切计算出术语总数量是难以做到的。根据有的学者广泛收集和悉心研究的结果,现在汉语科技术语至少有140万条以上[47]。这样庞大的科技术语群,其订名情况如何,统一与规范化如何,是个普遍关注的大问题。因为它是国家发展科学技术所必需的基础条件之一,是关系到国内外学术交流、教育、科研、经贸、生产和国防等各方面的大问题。同时科技术语状况如何,也是国家科技发展的重要标志。总的看,我国科技术语虽已有自己的独立体系,并发挥着巨大作用,但人们也深深体会到我国有些科技术语还处于不统一、甚至是混乱状态[7,12,13,15-18],也发现不少科技术语的订名尚需进一步改善。不少学者对我国科技术语开展了多方面研究,如从科学概念内涵角度、从术语学角度、从语言学角度、从词源和历史角度开展的研究等。但从科技术语的构词字数角度来探讨汉语科技术语和改善它们,则未见系统研究。而这方面与审定我国科技术语使之规范和完善,有着密切关系。故笔者拟根据现代术语学,对汉语科技术语的构词字数及有关问题,做些探讨。本文仅先以《物理学名词》(基础物理学部分)[60]和《电子学名词》(征求意见稿的修改稿)[61]为例,对此进行初步研究。二、统计与分析结果1.表1、表2分别列出《物理学名词》(基础物理学部分)和《电子学名词》(征求意见稿的修改稿)的术语构词字数及其百分率的统计结果。图1是它们的分布曲线。2.从图1我们可看到,两个学科汉语术语构词字数分布都有个极大值,而且均属4字术语,即4字术语最多(4音节术语最多)。它们占词条总数的百分率亦很相近,皆为30%左右(接近31%)。3.从基础物理学术语的分布曲线可见,曲线在字数较少半边的分布百分率明显地高于字数较多的半边,即由3、2、1字构成的术语明显多于由5、6、7或更多字构成的术语,就是说作为基础学科的物理学基础部分的术语,多为字数较少的术语,3字、2字的很多,1字的术语也不算很少。字数为7字、8字以上的术语的百分率,衰减很快,甚至只是个别的了。1至7字术语总和占术语总数的97.72%。图1 术语构词字数分布曲线4.从电子学术语的分布曲线可见,4字术语两侧曲线几乎是对称分布,由3、2字构成的术语数差不多与由5、6字构成的术语数目相等。1字术语很少,7、8、9字术语不少,10字以上术语也有一定数目。1至7字术语总和占术语总数的95.09%。5.从“物理”和“电子”两条术语分布曲线的对照上可见,曲线的低字数一侧(少于4字),物理学名词的百分率比电子学名词的百分率高;在曲线的多字数一侧(多于4字),电子学名词的术语百分率比物理名词的术语百分率高。就是说作为基础学科的物理学名词(基础物理部分)比作为技术学科的电子学名词,术语构词简短,在术语的简明性方面颇具特色。而随着新技术术语的增加,术语的构词字数明显增多,这可能是目前新技术术语的一个特点(术语较长)。三、讨论1.术语是概念的命名,是其语言符号。人类长期以来通过术语交流科技信息。虽然许多科学家、翻译家等学者为科技概念订名做了巨大贡献,但从现在我国科技界存在的大量术语中,还是可以看到有些术语是不尽妥善的。其中有的是一个概念出现多个术语;有的一个术语对应多个概念;也有的术语名不符其义。不少文献对此做了论述[20、21、48-55、59]。全国自然科学名词审定委员会正在组织科技界各学科专家和术语学家全面进行科技术语的审定,使之达到统一和规范化[2-4、8、30]。一个好的汉语科技术语应具有科学性、系统性、单义性、简明性、汉语特性、国际性和科技语体特性;在审定现有科技术语时,还要考虑其现实性(约定俗成)和协调统一性[25、29]。我在对《物理学名词》(基础物理学部分)和《电子学名词》进行调研时,看到不少经前辈和当代学者精心研究出来的术语是很符合术语的特性的,如衍射、阻尼、激光、电视等。但也有一部分术语我认为仍应进一步改进。2.从表1、表2和图1可见,这两个学科的基本术语中字数在7个字以上的还有不少,物理学名词(基础物理学部分)中有约2%,电子学名词中有约5%。其中有的术语长达14、15、16个字,甚至更多字(电子学中有的术语甚至有20字)。术语字数如此之多,有悖于术语的简明性,不利于口头和书面应用,对我国的科技术语体系也有不良影响。如在不影响术语的科学性、系统性、单义性、汉语特性和约定俗成等特性的前提下,适当使其简化,则应是所求的。考察该二学科术语构词字数多的原因,可有如下几种:(1)用字不够简练。如:自适应雷达(adaptive radar),可简化为“自适雷达”;直接检波式接收机(direct-detection reciver),可简化为“直检式接收机”。(2)含多人名术语,人名全部译出。如:亥姆霍兹—拉格朗日定理(Helmholtz-Lagrange theorem),麦克斯韦—玻耳兹曼分布(Maxwell-Boltzmann distribution)。如分别简化为“亥—拉定理”(或HL定理)和“麦—玻分布”(或MB分布),人们用惯了的话,可起到表达该概念的同等作用,而比较简洁,在口头和书面应用上均比较方便。(3)表达过于详细。如:场效应晶体管(field effect transistor),金属—氧化物—半导体场效应晶体管(metal-oxide-semicon-ductor transistor),低压化学汽相淀积(low pressure chemical vapor deposition)。如它们分别订为“场效晶体管”、“MOS场效晶体管”和“低压CVD”,则可使之简洁。当人们用习惯了,也可同样起到前而复杂表达的作用。在学术交流和书刊文献上用这些简化表达,很有好处(适当采用一此国际通用缩写词,还可改善汉语科技术语的国际性)。3.上面(2)、(3)两点中提出的术语简化方法,我认为它不单单是一般求得文字上的简练,而是跨上了一个订名术语的新台阶。术语的这个订名方法,可称之为合成法。它是以代表概念内涵的少数关键汉字或缩写词加上关键汉字构成术语的方法。著名的术语“激光”,固然是根据其概念内涵订出的,但从某种意义上讲,也可看成是以合成法形成术语的典型代表。“激光”的英文全称是light amplification by the stimulated emission of radiation,译成中文为“光受激辐射放大”或“激射光辐射放大”。后经钱学森先生订名为“激光”。这个订名既是其概念内涵的高明标示,也是上述全称的巧妙合成。类似的还有“崩越二极管”。它的英文名为impact avalanche transit time diode,曾译为“碰撞雪崩渡越时间二极管”。后来将其订名为“崩越二极管”,这不仅仅是全名的简单简化,因为它省略了很多也带有一定意义的字,只取出少数几个关键字表达其概念,形成单义的独特的术语(有别于一般词汇)。这个术语的形成,实际上也是运用了合成法。四、结语因为术语是概念的语言符号,其符号属性决定它不应繁复,而要简明。所以在全面顾及科学性、系统性、单义性、汉语特性和约定俗成等特性之后能使汉语科技术语的构词字数减至最少,是改善汉语科技术语,使之更符合术语学,更便于运用,并使之达到规范与统一的重要问题。订名术语时,不能把术语与定义混为一体,有些术语在简明订名之外,可运用定义使人们对其有清晰了解。对汉语科技术语构词字数的研究,有助于我们对我国汉语科技术语的全面了解,并有助于改进与完善汉语科技术语体系。用合成法订名汉语科技术语,可适当运用于各个学科领域,可在改善汉语科技术语的简明性方面发挥作用。吴凤鸣同志对原稿提出了宝贵意见,在此深致谢意。由于水平有限,文中可能有很多错误和不妥之处,希多加批评指正。  相似文献   

17.
“卡拉OK”是一个由中外文字组成的,由日语缩略语译作汉语的外来语,这个词的汉译名经历了一个很巧妙的转化过程。70年代初诞生的盒式录音机首先在日本盛极一时,比烟盒还小的一盘盘磁带为语言学习和学术交流的现场录音等带来了极大的方便。随后,唱片公司也很快推广...  相似文献   

18.
一、汉语拼音字符集在编码标准中被肢解的情况完整的汉语拼音字符集,按汉语拼音方案,应包括以下元素:大、小写拉丁字母共52个。带附加符号的ü、ê和、,共4个。带四声符号的韵母,a、o、e、ê、i、u、ü,每个对应有4个,再加大写形式,计7×4×2=56个。zh、ch、sh和ng的缩写形式、、、大、小写计8个。全部总计52+4+56+8=120。国家标准GB 2312-80是国内使用最重要、最广泛的字符编码标准,其中收入了大、小写拉丁字母、最广泛52个及小写字母a,e,i,o,u,ü的调号形式及ü和ê共26个。标准收入总计52+26=78个。比全集字符少了120-78=42。缺少的字符中,zh、ch、sh、ng的缩写形式大小写8个是可以避免使用的,但其它36个一般是不可少的。这种基本字符缺失是被肢解的表现之一。被肢解的另一表现是,国家标准中,汉语拼音字符的顺序是散乱的,编码字符串的顺序与汉语拼音词条顺序不一致。汉语拼音字符在中国国家编码标准中尚且如此,在有关国际编码标准中情况只能更糟。二、直接原因是“名不正”上述汉语拼音字符集被肢解的直接原因是“名不正”。因为编码标准名为“信息交换用汉字编码字符集”。汉字编码自然主要解决汉字问题。汉语拼音字符通常不认为是汉字,能给予现今的安排已属“照顾”。编码工作的承担者在面对肢解的批评时,可以十分自然、十分有理的回答:国家下达的或者承担者申请的或只是“汉字编码字符集标准”。三、如何正名汉字是中国现行文字的主体,但汉字不是中国现在通行文字的全体或整体。对整体和部分应有区别。依笔者愚见,这整体不妨称“汉文字”或“汉文”。汉文应包括汉字、拉丁字母和阿拉伯数码及其它必不可少的符合。这类似于我们已经习惯使用的“日文”。日文中自然至少包括日本汉字和假名字母。据此。“汉字编码”可改为“汉文字编码”或“汉文编码”。“汉字系统”可改为“汉文字系”或“汉文字系统”。现今的汉字系统确实都十分冷落汉语拼音。在大多数系统中,输带调号的汉语拼音只能用国标码,比输汉字还麻烦。四、名字背后的根本原因现今中国通用文字的命名确实不是简单符号选择问题,象给初生儿起名那样。现状反映出拼音字母虽有法律地位,但作为中国文字的一部分、作为文字的性质还是没有取得社会普遍的公认。在汉字信息处理技术的突飞猛进前,汉语拼音有更被冷落的趋势,或者是产生了对汉语拼音方案修订的需要。  相似文献   

19.
通过藏文字丁的预处理、特征的提取、特征变换、分类器设计和音节联想,完成了一个完整的联机手写藏文识别系统。提出了对手写藏文字丁进行的噪声去除、字丁笔划均匀化、归一化的预处理方法及将藏文字丁特征提取和特征融合算法,将二维线性鉴别分析方法用于藏文字丁识别特征的降维处理,改进了标准二次分类器并用于藏文字丁的快速识别,提出了藏文字丁的音节联想算法,对藏文信息输入的研究奠定了基础。该系统有效解决了藏文字丁数量大、字型结构复杂、非方块藏文字丁相似字比例极高的识别难点问题,藏文字丁的平均识别率达到94%以上,字丁的音节联想进一步提高了联机藏文手写识别的输入效率。  相似文献   

20.
从仓颉造字的古老传说到100多 年前甲骨文的发现,历代中国学者一 直致力于揭开汉字起源之谜。 关于汉字的起源,中国古代文献上 有种种说法,如“结绳”、“八卦”、“图 画”、“书契”等,古书上还普遍记载有 黄帝史官仓颉造字的传说。现代学者 认为,成系统的文字工具不可能完全 由一个人创造出来,仓颉如果确有其 人,应该是文字整理者或颁布者。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号