首页 | 本学科首页   官方微博 | 高级检索  
     

遗传学部分新名词的译名和解释
引用本文:赵寿元. 遗传学部分新名词的译名和解释[J]. 中国科技术语, 2000, 2(3): 44-48
作者姓名:赵寿元
作者单位:复旦大学遗传学研究所 上海 200433
摘    要:基因组 genomeGenome这个名词于1922年第一次出现在遗传学文献中。中文译名为染色体组,后又译为基因组。随着遗传学研究的进展对基因组的涵义不断地赋以新的内容。一般的定义是单倍体细胞中的全套染色体为一个基因组,或是单倍体细胞中的全部基因为一个基因组。可是基因组测序的结果发现基因编码序列只占整个基因组序列的很小一部分。比如,人基因组中编码序列只占5%左右,换言之,人基因组中的非编码序列占95%以上。因此,基因组应该指单倍体细胞中包括编码序列和非编码序列在内的全部DNA分子。说得更确切些,核基因组是单倍体细胞核内的全部DNA分子;线粒体基因组则是一个线粒体所包含的全部DNA分子;叶绿体基因组则是一个叶绿体所包含的全部DNA分子。当然,也有人指出基因组应定义为一个细胞中所携带的全部遗传学指令。这是从基因组的功能着眼,因为基因组中的基因携带着编码产生蛋白质或RNA的遗传指令,同时基因组中的非编码序列携带着启动和调控基因活动的遗传指令。但是,基因组如果定义为全部遗传指令,那么,基因组的测序、作图和基因识别等就不易被人理解,遗传指令又怎么测序和作图呢?人类基因组计划 human genome project,HGP一般是指于1990年美国政府资助启动的研究人类基因组的计划。它被认为是生命科学研究领域中有史以来的第一个“大科学”项目,其意义和影响被誉为不亚于研究原子弹的“曼哈顿计划”和载人飞船登月的“阿波罗计划”。以后世界各国也都有各自的研究人类基因组的计划。HGP的主要内容是美国计划从1990至2005年间,历时15年,资助30亿美元,测定人类基因组的30亿对核苷酸的排列次序。由于实验操作上的考虑,必须把基因组DNA分子先打断成无数个小片段,然后测定每个小片段的核苷酸序列,最后把小片段连接回复到整个基因组。因此在测序前要先作图(mapping),即把每个小片段在整个基因组上的位置确定下来,以便今后可以有序地把小片段连接起来。HGP的工作内容除了作图和测序外,还有基因识别,模式生物(如大肠杆菌、酵母、果蝇、线虫和小鼠等)基因组的测序,发展生物信息学(bioinformatics)和研究HGP对伦理、法律和社会带来的冲击和影响等。在HGP实施过程中,特别是基因识别和基因克隆的成果,显现出巨大的商机。于是一些大跨国公司特别是医药行业的大财团纷纷斥巨资介入人类基因组研究领域。1998年5月美国的塞莱拉基因组学公司(Celera Genomics Inc.)宣布将于2001年完成人类基因组的工作草图(working draft),并于2003年最终完成人类基因组测序,在此态势下,美国政府也于1998年10月宣布调整HGP的工作进度,提前于2003年底前完成基因组测序。2000年6月26日,有美、英、德、日、法和中国参加的国际人类基因组测序联合体与美国塞莱拉公司联合宣布各自分别完成了人类基因组的“工作草图”。中国承担并完成了人类基因组1%的测序,即测定3000万对核苷酸序列。人类基因组工作草图 human genome “working draft”人类基因组的作图和测序是一个由粗到精的过程,是先把整个基因组打断成小片段,然后再把小片段连接复原。工作草图又称框架图,是一幅粗线条地绘制成的基因组图,它的特点有三:①应包含人体绝大多数基因的序列;②由于作图是由小片段连缀而成,所以会因丢失小片段而在图上留下空档(gap),工作草图可以留下空档,但对整个基因组的覆盖率应在90%以上;③草图中核苷酸序列的差错率可以高于最终所要求的万分之一,但不能超过百分之一。作图 mapping基因组研究中,确定遗传标记如基因、酶切位点、特定的DNA序列等在染色体上的位置,并计算它们之间的距离,称为作图。图可以分为遗传图(或遗传连锁图)、物理图两种。遗传图是根据两个遗传标记之间发生重组的频率来确定彼此在染色体上的位置和距离。两者相距远,发生重组的频率高;两者相距近,则连锁很紧密,不易发生重组。如果两个遗传标记分别位于两条染色体上也就不会发生重组。重组发生在细胞减数分裂期间,因此要分析上下代的染色体上的遗传标记出现的频率方能计算出两个标记在染色体上的相对距离。物理图则是把遗传标记直接定位在染色体DNA分子上,彼此间的距离也可用碱基对的多少来标定。基因组DNA测序后的全序列图是最精密的物理图,因为这幅图表明了几十亿个核苷酸的排列次序,标记物就是单个核苷酸。叠连群 contig一组克隆载体中插入的DNA片段,可通过末端的重叠序列相互连接成为一个连续的DNA长片段,这一组DNA片段即构成了一个叠连群。叠连群主要用于DNA测序和基因组作图。因为DNA的测序和作图时,一个很长的DNA分子在实验时是无法操作的,必须把它先切割成为小片段,然后把小片段连接起来,就是通过两个小片段末端共有的序列,相互叠加而连成长片段。因此,叠连群中小片段之间叠加的相同序列越短,研究工作效率则越高。表达序列标签 EST,expressed sequence tag在人类基因组研究中,有一个区别于“全基因组战略”的“cDNA战略”,即只测定转录的DNA序列,也就是测定基因转录产物mRNA反转录产生的互补DNA——cDNA。cDNA代表了基因中编码蛋白质的序列。EST则是cDNA的一个片段,一般长200~400个核苷酸对。一个全长的cDNA分子可以有许多个EST,但特定的EST有时可以代表某个特定的cDNA分子。两端有重叠的共有序列的EST可以组装成一个叠连群(contig),直到装配成全长的cDNA序列,这样就等于是克隆了一个基因的编码序列。将EST定位在基因组,也可作为基因组作图时的一种标记序列。互补DNA cDNA,complementary DNA信使RNA(mRNA)分子的双链DNA拷贝。构成基因的双链DNA分子用一条单链作为模板,转录产生与其序列互补的信使RNA分子,然后在反转录酶的作用下,以mRNA分子为模板,合成一条与mRNA序列互补的单链DNA,最后再以单链DNA为模板合成另一条与其互补的单链DNA,两条互补的单链DNA分子组成一个双链cDNA分子。因此,双链cDNA分子的序列同转录产生的mRNA分子的基因是相同的。所以一个cDNA分子就代表一个基因。但是cDNA仍不同于基因,因为基因在转录产生mRNA时,一些不编码的序列即内含子被删除了,保留的只是编码序列,即外显子。所以cDNA序列都比基因序列要短得多,因为cDNA中不包括基因的非编码序列——内含子。克隆 clone用作名词时,克隆是指由遗传组成完全相同的分子、细胞或个体所组成的一个群体。例如,核苷酸序列完全相同的DNA片段或基因的众多份拷贝,就称为DNA分子克隆或基因克隆。来源同一个祖细胞的基因型完全相同的众多子细胞,就构成了一个细胞克隆。抗原分子刺激后会产生抗体分子,如果是一种抗原分子刺激后产生的是单克隆抗体;如果是多种抗原分子刺激后产生的则是多克隆抗体。通过无性繁殖获得相同基因型的生物体,这是个体克隆,也称为无性繁殖系。用作动词时,克隆是指运用DNA重组技术将某一特定基因或DNA序列,插入一个载体分子,然后将这个重组分子转入宿主细胞中复制增殖,使被插入的基因或DNA分子形成众多的拷贝。克隆也指分离出单个分子或单个细胞的操作过程。例如,克隆基因是指从基因组或DNA大片段中分离出某个基因或某种DNA序列;克隆细胞则是从许多类型的细胞群体中分离出某种特定类型的细胞。用作动名词(cloning)时,指分离出某一特定的基因、DNA分子或细胞后,用一些实验方法使在数量上增多以形成由许多份拷贝构成的一个群体,有时将这一过程称为克隆化。模式生物 model organism在人类基因组研究中十分注重模式生物的研究,这是由于要认识人体基因的功能,无法直接用人体作为实验对象。但是,生物是从共同祖先演化而来的,所以对生命活动有重要功能的基因在进化上是保守的,也就是说,这些基因的结构和功能,在低等生物和高等生物中是相似的。因此,可以用比较容易研究的生物作为模型来研究其基因的结构和生物学功能,由此获得的信息可以使用于其他比较难以研究的生物,特别是推测相似的人体基因的功能。例如,果蝇、小鼠甚至酵母等基因组都有与癌症发生相关的癌基因和抗癌基因,与细胞死亡、衰老有关的基因,以及与引起人类某些遗传病的相关基因。染色体 chromosome指经染料染色后用显微镜可以观察到的一种细胞器。在细菌中,染色体是一个裸露的环状双链DNA分子。在真核生物中,当细胞进行分裂期间染色体呈棒状结构。染色体的数目是随物种而异,但对每一物种而言,染色体的数目是固定的。比如人的染色体在二倍体细胞里是46条,在生殖细胞里则是23条。染色体是由线性双链DNA分子同蛋白质形成的复合物,真核生物的核基因就分藏在每条染色体中,所以,染色体是基因的载体,也就是遗传信息的载体。一个细胞里的全部染色体也就包含了这个生物体的全部遗传信息。序列 sequenceDNA分子是由4种核苷酸(A,T,G,C)排列组成,DNA序列就是组成某一DNA分子的核苷酸的排列次序。蛋白质的一级结构是由20种氨基酸线性排列构成。蛋白质序列就是构成某种蛋白质如氨基酸线性排列次序。因此,测序(sequencing)就是用实验方法,测定DNA分子中核苷酸的种类及其排列次序,或者测定蛋白质分子中氨基酸的种类及其排列次序。人基因组测序是指测定构成人基因组的约30亿个核苷酸的种类及其排列次序。基因组中的DNA序列可以分为两大类:一类是单一序列,即在基因组中这种核苷酸的排列次序只出现一次或只有一份拷贝;另一类是重复序列。指某种核苷酸排列次序在基因组出现的次数或其拷贝数少则几份,十几份,多的可达几万份甚至几十万份。构成基因的极大多数是单一序列。重复序列则基本上全是非编码序列,它们的生物学功能是一个尚未解开的谜团。遗传密码 genetic code这是支配信使RNA(mRNA)分子中4种核苷酸的线性序列,同由它编码的蛋白质中20种氨基酸的线性序列之间关系的法则。基因是DNA分子。DNA分子由4种核苷酸(A,T,G,C)排列组成。不同的基因所携带的不同的遗传信息,编码在不同的核苷酸序列中。遗传信息要翻译成另一种语言即蛋白质的氨基酸序列,才能实现其生物学功能。可是,DNA并不是直接把遗传信息传递给蛋白质,而是先转录成mRNA,然后以mRNA为中介来决定蛋白质中的氨基酸序列。一个线性mRNA分子的核苷酸序列,决定一个线性的蛋白质分子的氨基酸序列。mRNA同DNA一样,也是由4种核苷酸组成,所不同的只是mRNA用U代替了T,即A,U,G,C4种核苷酸。蛋白质由20种氨基酸组成。mRNA分子中的核苷酸以三个为一组,如AAA,AUA,AUG……构成了一个密码子;一个密码子决定一种氨基酸。mRNA的4种核苷酸组成的密码子可以有43=64种。64种密码子决定20种氨基酸。因此密码子是冗余的或简并的,即一种氨基酸可以有不止一个密码子。比如编码甘氨酸的密码子就有4个:GGU,GGC,GGA和GGG,编码精氨基酸的密码子则有6个:CGU,CGC,CGA,CGG,AGA和AGG。不同的基因有不同的核苷酸序列,决定不同的氨基酸序列,产生不同的蛋白质,行使不同的生物学功能,最后使生物体出现不同的性状。这种遗传密码是在20世纪60年代早期破译的。基因库 gene pool有性生殖生物的一个群体中,能进行生殖的个体所携带的全部基因,或全部遗传信息,或者是一个群体中所有个体的基因型的汇总。对二倍体生物而言,有N个个体的一个群体的基因库,由2N个单倍体基因组所组成。基因文库 gene library一个生物体的基因组DNA用限制性内切酶部分酶切后,将酶切片段克隆在载体DNA分子中,所有这些插入了基因组DNA片段的载体分子的集合体,将包含了这个生物体的整个基因组,也就是构成了这个生物体的基因文库。基因型分型 genotyping这是确定一条染色体上一些基因,DNA序列或遗传标记的连锁组合,实际上就是确定一条染色体上某个区段的单体型(haplotype)。现在有的译为基因分型是不够确切的,因为分型的不止有基因,而主要是遗传标记。共线性 synteny一个物种的基因组中相互连锁的基因,在另一物种的基因组中也是连锁关系,而且在两个物种的遗传图上的位置也是相似的。例如,人和小鼠之间就有一百多个共线区。在进化过程中一些基因始终保持着连锁关系,这意味着这种连锁可能在一定条件下具有选择上的某种优势。这对研究基因功能之间的相互关系提供了有用的线索。种间同源基因 ortholog不同物种中起源于一个共同的祖先基因的一些同源基因。这些基因通常保持着相同的或相似的功能。种内同源基因 paralog在进化过程中的一个基因通过重复而生成许多个基因,这些基因逐步分化成为不同的基因,这些不同的基因称为种内同源基因。例如,在脊椎动物进化过程中,祖先珠蛋白基因位置重复而后逐步分化成α珠蛋白基因、β珠蛋白基因和肌球蛋白基因等。混编 shufflingShuffling的原意是扑克牌的洗牌,54张牌在洗牌后可以有无数种的排列组合。在新基因的生成和基因进化研究中,借用shuffling这个词,提出了“外显子混编(exon shuffling)”和“结构域混编(domain shuffling)”等假说。即新的基因是由原来的基因打断后的断片混编而成的,或者是由编码蛋白质结构域的基因片段混编而成。这种基因片段可能就是外显子,因此称为外显子混编。表观遗传学 epigenetics研究基因的核苷酸序列不发生改变的情况下,基因表达出现了可遗传的变化的一门遗传学分支学科。表观遗传的现象很多,已知的有DNA甲基化,基因组印记(genomic imprinting)和RNA编辑(RNA editing)等。朊粒 prion蛋白质性质的感染颗粒的简称。(我注意到对这个译名有不同的意见,已提出的有“朊病毒”,“感染朊”或干脆音译为“普立昂”。朊病毒有点牵强附会,prion并不具有病毒的特征。感染朊是可以考虑的,但不如朊粒简明。)酶性核酸 ribozyme具有酶一样催化活性的核酸分子,有的译为“核酶”似不大贴切。* 赵寿元教授是全国科学技术名词审定委员会第四届委员会委员;遗传学名词审定委员会主任(第二届)。(注:“小词典”栏中的词目并不都是经审定过的规范词。)


Denominations and Explanations of Partial New Terms in Genetics
Zhao Shouyuan. Denominations and Explanations of Partial New Terms in Genetics[J]. Chinese Science and Technology Terms Journal, 2000, 2(3): 44-48
Authors:Zhao Shouyuan
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
点击此处可从《中国科技术语》浏览原始摘要信息
点击此处可从《中国科技术语》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号