首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 312 毫秒
1.
基于GenBank构建的外显子内含子数据库(EID)含有大量的冗余数据.为了解决冗余问题,构建了基于RefSeq的非冗余EID(non-redundant EID).RefSeq是由NCBI staff负责维护和更新的参考序列库,为基因组注释、基因识别、基因突变、多态性分析、表达研究和比对分析提供了一个稳定的参考.该EID可用于大规模分析Exon/Intron结构和内含子剪切(Splicing)的研究,并拥有一些内部机制来控制数据质量和可能出现的错误.同时,它的新的改进是增加了基因序列中非翻译区(UTR)的数据内容.该文对构建基于RefSeq的非冗余EID的一些技巧作出说明.  相似文献   

2.
由NCBI建立和维护的大型公用数据库GenBank是进行生物学研究最为重要的工具之一. 其DNA序列数据库的每条记录描述了相关基因的详细特征,其中的CDS(Coding Sequence)特征域被认为是DNA生成蛋白质的翻译指令,它对GenBank中每条基因的组装进行了详细的说明. 通过CDS可以很容易在互联网上进行多序列搜索,并获得相关的基因序列、编码蛋白序列及种属特异性信息. 利用CDS特征域构建外显子-内含子数据库(Exon-Intron Database,EID)是研究内含子起源、进化和功能的重要手段,本文试图以CDS为线索,解决建库初期从GenBank海量数据中提取相关序列的问题.  相似文献   

3.
研究成熟mRNA序列与其相应内含子序列的相互作用规律对于揭示基因表达调控具有重要意义.本文以黑腹果蝇第一号染色体蛋白质编码基因序列为研究对象,采用SmithWaterman局域比对的方法,在mRNA序列和内含子序列之间进行匹配性比对分析.研究发现剪切后的内含子序列与基因的5′UTR序列和3′UTR序列的相对匹配频数高于编码(CDS)序列.最佳匹配片段集合的G+C含量分布范围很广,其分布中心与3′UTR序列最为接近,5′UTR序列次之,距离CDS序列最远,这是导致两端UTR序列与内含子序列有较高匹配强度的原因.最佳匹配片段的配对率主要分布在68%~75%之间,最可几长度为20bp左右,最佳匹配片段的序列特征与miRNA相似.结果显示内含子与mRNA之间的这种匹配模式是参与基因调控的一种可能方式.  相似文献   

4.
根据GenBank的序列数据,构建了真核生物内含子数据库(EID).对EID统计规律的研究表明,数据库共有103 848个基因,478 484个内含子,582 332个外显子,平均每个基因有4.61个内含子,5.61个外显子,内含子长度为40~120个核苷酸的最多.对人、大鼠、小鼠、鸡、果蝇、线虫、拟南芥、玉米和裂殖酵母等9种模式生物的数据的统计分析表明,在真核生物中,并不是生物越高等,基因中的内含子数或外显子数就越大.进一步,对各种模式生物的基因组大小与内含子比例及内含子密度的关系、内含子相位、内含子剪接位点等特征进行了统计研究.  相似文献   

5.
通过下载国际一级序列数据库GenBank的序列数据,开发研制了真核生物基因内含子数据库EID,该数据库由一个主数据库和多个子数据库组成,子数据库包括细胞核内含子数据库、细胞器内含子数据库,以及植物、无脊椎动物、灵长类、啮齿类、其他哺乳类和其他脊椎动物等不同类型生物内含子数据库.文中详细介绍了数据的获取和筛选方法,主数据库中dEID,pEID,hEID的文件格式和结构,EID数据库构建程序,以及EID的查询方式,提供的分析工具等.EID将建设成为研究内含子功能和进化起源的生物信息学平台.  相似文献   

6.
八肋游仆虫中ECD1基因的克隆及序列分析   总被引:1,自引:1,他引:0  
含有CHROMO(chromatin organization modifier)结构域的蛋白参与了异染色质的形成及转录沉默复合物的形成.原生动物游仆虫细胞中既含有转录活跃的大核也含有转录沉默的小核.本实验应用PCR技术从八肋游仆虫(Euplotes octocarinatus)中获得了一个编码含有CHROMO结构域的基因ECD1(Euplotes chromo domain-con-taining protein 1)(GeneBank登录号为FJ357578).大核中含有该基因的微小染色体全长1105 bp.小核中该基因内无内部删除序列IES的存在.通过RT-PCR,证实该基因开放阅读框为645 bp.大核基因中含有三个内含子,转录过程中这些内含子均符合一类内含子GU-AG剪切规则.DNAstar软件分析,该基因编码的蛋白质包含214个氨基酸,分子量24.7 kDa,等电点为5.48.结构域聚类分析表明Ecdl蛋白可能执行与四膜虫异染色质蛋白Pddlp和Pdd3p相似功能,参与大核发育过程中异染色质的形成和IES序列的删除.  相似文献   

7.
为了解鸡SH3RF2基因的结构与功能,由NCBI数据库获得鸡SH3RF2基因的mRNA和氨基酸序列数据信息,利用NCBI/Blast软件进行序列分析、同源性比对确定鸡SH3RF2基因的3’UTR区序列。在此基础上,利用公共数据库和相关软件对SH3RF2基因的CDS(coding sequence)区和其3’UTR(untranslated region)区进行了MicroRNA靶标的预测分析,进一步利用生物信息学相关数据库对其蛋白理化性质和一级结构进行分析,模拟了其二级结构和空间结构并构建了SH3RF2蛋白的系统进化树。  相似文献   

8.
讨论了L1在人类染色体中的分布密度与染色体长度以及L1的密度与基因密度之间的关系.发现在大多数染色体上L1的密度和染色体的长度表现为正相关,而L1的密度和染色体中基因的密度表现为负相关;对人类L1的5′UTR进行了详细的研究后,发现在L1元件的5′UTR部分含有许多转录因子结合位点.对基因的转录起始位点上游进行统计分析,发现其中含有大量的L1序列.通过对人类的EST数据库进行BLAST分析,新发现了51条和人类L1 5′UTR相似性较高的EST片断,根据它们分布的组织特异性,说明L1元件可能调控与发育过程有关的基因的表达;最后应用多样性增量的方法对人类和大鼠的L1 5′UTR进行了区分,得到了较好的预测结果,说明大部分L1的5′UTR的调控作用是人类特有的.  相似文献   

9.
基于CDS..join特征域的Exon/Intron数据库的构建   总被引:1,自引:1,他引:0  
基因进化的研究和重构通常是在序列水平上进行的,包括比对它们的遗传序列或蛋白序列。而对基因外显子/内含子结构的分析能够提供更多有价值的信息,比如绘制更为可靠的系统发生图谱,或更精确地阐明内含子的进化。为此,本文设计了相应的Perl脚本程序来提取、比较和搜索基因说明文档中CDS..join特征域的Exon/Intron结构。通过该方法,可构建相关物种的Exon/Intron数据库(EID),其主要内容包括内含子的相位,Exon或Intron的数量、大小,剪接位点的模式以及选择性剪接(Alternative splicing, AS)的相关信息。  相似文献   

10.
含有CHROMO(chromatin organization modifier)结构域的蛋白参与了染色质结构的调节.本研究从嗜热四膜虫(Tetrahymena thermophila)全基因数据库(www.ciliate.org)和基因表达数据库(tged.ihb.ac.cn)中筛选到有性生殖特异表达TCD3(Tetrahymena chromo domain-containing protein 3)基因.该基因ORF为1 005bp,大核染色体中基因全长1 241bp,含有两个内含子.5′-RACE和3′-RACE表明5′端非编码区(5′-UTR)长度为40bp,3′端非编码区(3′-UTR)长度为90bp.TCD3基因预测编码334个氨基酸构成,含有一个CHROMO结构域.CHROMO结构域聚类分析表明四膜虫Tcd3蛋白可能与线虫CeCDP功能类似,参与异染色质的形成和DNA序列删除.  相似文献   

11.
以牛的ANGPTL1基因为研究对象,利用生物信息学方法,对牛的ANGPTL1基因进行了电子克隆和序列分析,并对推导出的ANGPTL1蛋白结构与性质进行了初步分析。结果表明,牛的ANGPTL1基因序列长为2576bp,该基因的编码序列长为1476bp,编码492个氨基酸,编码序列的两翼有135bp的5’非编码区和785bp的3’非编码区。DNA序列的G+C百分含量为44.31%,A+T百分含量为55.69%。该基因的核苷酸序列与人、黑猩猩、鼠和狗ANGPTL1基因的cDNA序列的相似性分别为91%、90%、82%和93%。在氨基酸序列上与人、黑猩猩、鼠和狗的相似性分别为95%、95%、92%和95%。用氨基酸序列构建的进化树显示,在人、牛、黑猩猩、狗、褐鼠、原鸡几种动物中,牛与狗的亲缘关系最近。  相似文献   

12.
研究对中国四个小型猪五指山猪、贵州香猪、滇南小耳猪和藏猪的生长激素基因(pGH,porcine growth hormone)进行了克隆测序及构建分子进化树,考察该激素对小型猪体型的影响。通过筛选合适的引物,采用PCR技术,扩增了四个小型猪品种的pGH基因全序列,并对其进行了克隆测序分析。4个小型猪品种pGH基因全长为2006bp,包括5个外显子和4个内含子,CDS全长为648bp。将4个品种小型猪和长白猪、雅南猪、内江猪进行了核苷酸序列比对,共有63处发生了变异,变异率为2.9%,其中外显子有12处变异,全部为转换;内含子有51处发生了变异,包括转换、颠换和缺失。聚类结果基本符合其地方猪种的地理位置分布原则。  相似文献   

13.
Structure of the human immune interferon gene   总被引:62,自引:0,他引:62  
P W Gray  D V Goeddel 《Nature》1982,298(5877):859-863
Sequence determination of cloned cDNAs and genes of the three classes of interferon (IFN-alpha, -beta and -gamma) has revealed more than a dozen members of the human IFN-alpha gene family and a single gene for IFN-beta. These genes are found on chromosome 9 and contain no introns. We recently reported that the 146-amino acid sequence of mature IFN-gamma deduced from the nucleotide sequence of a cloned cDNA was quite unrelated to those of the other IFNs, and that the gene for IFN-gamma contains at least one intron. We now describe the isolation, characterization and DNA sequence of the human IFN-gamma gene. It contains three introns, a repetitive DNA element, and is not highly polymorphic. All our evidence to date and the present data suggest that this is the only gene for IFN-gamma and that the resolution of IFN-gamma into two components is probably the result of post-translational processing of the protein.  相似文献   

14.
利用热启动PCR法分别从矮紫杉、欧洲红豆杉以及中国红豆杉基因组DNA中首次克隆到长度为1456bp的BAPT基因全长序列。序列分析结果表明:三种红豆杉BAPT基因序列的同源性达到了97.4%;将三种红豆杉的BAPT序列与NCBI上登录的BAPTcDNA序列相比对,发现其均含有1个核苷酸序列高度保守的110bp左右的内含子。  相似文献   

15.
A role for branchpoints in splicing in vivo   总被引:2,自引:0,他引:2  
G Rautmann  R Breathnach 《Nature》1985,315(6018):430-432
The nucleotides immediately surrounding intron/exon junctions of genes transcribed by RNA polymerase B can be derived from 'consensus' sequences for donor and acceptor splice sites by only a few base changes. Studies in vivo have underlined the importance of these junction nucleotides for splicing. In higher eukaryotes, no evidence has been found for specific internal intron sequences involved in splicing. However, the recent discovery that, in vitro, introns are excised in a lariat form where the 5' end of the intron is joined via a 2'-5'-phosphodiester linkage to an A residue (branchpoint acceptor) close to the 3' end of the intron, suggests that internal intron sequences may nonetheless be important for splicing. Indeed, in yeast nuclear genes, the internal sequence 5'-TACTAAC-3' (or close homologue) is essential for splicing in vivo. A proposed consensus sequence for branchpoints in mammalian introns is 5'-CT(A/G)A(C/T)-3'. This sequence resembles the essential yeast internal sequence. Are branchpoints involved in the splicing of introns of higher eukaryotes in vivo? We show here that a branchpoint sequence from a human globin gene (5'-CTGACTCTCTCTG-3') greatly enhances the efficiency of splicing of a 'synthetic' intron in HeLa cells. A mutated branchpoint sequence, 5'-CTCCTCTCTCTG-3', in which the branchpoint acceptor nucleotide A has been deleted and the neighbouring purine G mutated to a C, does not exhibit this enhancing capability. We conclude that branchpoints have an important function in the splicing process in vivo.  相似文献   

16.
用鼠的色素上皮衍生因子cDNA序列在猪的ESTs库进行BLASTn搜索,得到一系列不同大小的ESTs片段,经拼接得到完整cDNA序列.序列分析显示该cDNA长1 425 bp,有一个1 242 bp的开放阅读框,编码413个氨基酸,5’非编码区长53 bp,3’非编码区长130 bp,有一个加尾序列和多聚腺苷酸尾巴.其核苷酸序列与牛、人和鼠的同源性分别为89%、87%和82%,氨基酸的同源性分别为89%、87%和84%,且有保守的糖基化位点、半胱氨酸位点和serp in基序,说明所克隆的cDNA序列为猪的PEDF全长cDNA.  相似文献   

17.
用计算机对人类TSPYl基因P53结合位点的鉴定   总被引:2,自引:0,他引:2  
根据p53下游基因在其调节区域(启动子或内含子)含有与P53蛋白特异性结合的一致性序列5’-RRRCWWGYYYN(0-13)RRRCWWGYYY-3’,R—G或A,W—T或A,Y—C或T,N—A,C,T,G。用计算机对人类基因组中P53结合位点进行了研究,发现Y染色体上的TSPY1基因内含子中含有这样的一致性序列5’-GGGCTAGTTTtgGAGCTAGCCT-3’,意味着TSPY1基因有可能是一个p53下游基因。  相似文献   

18.
人类基因组表达序列筛选是寻找候选基因的重要路线之一,外显子陷阱法,cDNA直接筛筛选法,它们可分别根据表达序列的结构及表达特点进行筛选,EST是表达图的位标,它们是一些位点专一的表达序列位标,根据EST的特征,在国内首次建立了一种从EST出发的筛选候选基因的新方法,用睦方法已在人X染色体Xq13区段筛选得到了一个新的cDNA,总测序徇的1398bp包含了完整的3末端。  相似文献   

19.
根据甘蓝型油菜S-GT(thiohydroximate S-glucosyltransferase)基因cDNA序列设计引物,以海甘蓝总DNA为模板进行PCR扩增.获得S-GT基因全长.克隆的海甘蓝S-GT序列与甘蓝型油菜序列相比,除74 bp的内含子部分外有92个碱基的差别,相似性高达93.4%.分析显示该序列均有完整的开放阅读框,并表明所克隆的海甘蓝S-GT序列编码465个氨基酸,在第10个位点上比甘蓝型油菜序列少一个丙氨酸(A),总共有23个氨基酸不同,相似性为95.06%.根据获得的基因序列设计引物扩增出同一基因序列相同但是带有不同酶切位点的两个片段,将两个片段反向插入到已构建的带有种子特异表达载体内含子的两端,成功构建了海甘蓝S-GT基因的种子特异性hpRNAi载体,为特异性降低海甘蓝的种子硫甙奠定了基础.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号