首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
基因组序列中蛋白编码区的正确预测是后基因组时代的一个重要工作.采用分解子序列的方法将DNA序列映射为数值序列,然后对其进行功率谱分析,DNA序列的功率谱曲线的峰值位置刚好和编码区序列相对应,从而实现了对基因组序列编码区的预测.理论分析和大量计算机实验证实了方法的有效性,预测的探测率和正确率分别达到97%和88%,预测效果良好.该方法不需要基因组序列的任何先验知识,应用面广.  相似文献   

2.
利用GenBank中欧洲鲇的线粒体基因组序列, 设计出6对引物, 通过PCR扩增产物直接测序和引物行走(primer walking)法测定了兰州鲇的线粒体基因组序列, 并对其进行结构分析。兰州鲇线粒体基因组序列全长16524 bp, 包括37个基因(2个rRNA基因、22个tRNA基因和13个蛋白质编码基因)和1个非编码区。用最大似然法对鲇形目11种鲇鱼线粒体基因组的13个蛋白质编码基因的核苷酸序列进行系统发育分析。结果显示, 兰州鲇首先跟其他鲇科鱼类聚为一支, 形成一个单系群, 位于系统发育关系树的中部。  相似文献   

3.
人转铁蛋白基因的克隆及序列分析   总被引:1,自引:0,他引:1  
目的:克隆人转铁蛋白基因并对其编码序列进行分析.方法:以人胎肝cDNA为模板,利用PCR方法克隆人转铁蛋白基因;通过与基因组序列对比分析基因组结构;通过TargetP 1.1和SignalP 3.0预测信号肽;通过Clustal X(1.81)进行蛋白序列联配.结果:PCR扩增了一个长2 160 bp的基因片断,序列分析表明其覆盖了完整编码框,编码由698个氨基酸组成的人转铁蛋白.进一步分析发现人转铁蛋白基因有19个外显子和18个内含子,编码人转铁蛋白N端具有19个氨基酸组成的信号肽序列.人转铁蛋白与猩猩、猴子、兔子和老鼠的转铁蛋白氨基酸相似率分别为94%、91%、78%、73%.生物信息分析表明,人转铁蛋白含有高度保守的参与蛋白二硫键形成的半胱氨酸以及铁离子结合位点,有两个序列较同源的结构域.结论:成功克隆人转铁蛋白基因,人转铁蛋白与其它物种转铁蛋白同源.  相似文献   

4.
病毒基因组中的重复序列比率很低,因为其核酸序列大都是编码区域.如果出现一段同向对称或者是反向对称序列在病毒基因组中,它往往代表一个调控元件,或者是一个信号因子.我们总结了病毒中的一些对称序列,并阐明它的特点,分布及功能.  相似文献   

5.
利用Illumina和Pacbio测序技术对扬子鳃蛭(Ozobranchus jantseanus)线粒体基因组全序列进行测序及注释,并与NCBI数据库中蛭纲(Hirudinea)其他物种的线粒体全序列的排列方式和系统进化关系进行了比较,以确定其系统学地位.结果显示:获得的线粒体基因组序列长度为14 868 bp,蛋白编码基因存在2种起始密码子,分别为ATG和ATT;终止密码子共有4种,分别为TAA,TAG,TA和T;蛭纲10个物种的线粒体基因组全序列基因排序可分为2种类型,其差异表现在tRNAs的互换和长非编码区的长度的不同;扬子鳃蛭所属的吻蛭目(Rhynchobdellida)均为b型,绝大部分无吻蛭目(Arhynchobdellida)的排列方式为a型.基于蛭纲物种的13个蛋白编码基因(PCGs)的Neighbor-Joining(NJ)树进化分析显示,扬子鳃蛭与其他吻蛭目物种聚类.  相似文献   

6.
疣尾蜥虎线粒体基因组全序列及其基因组成   总被引:1,自引:0,他引:1  
测定了疣尾蜥虎(Hemidactylus frenatus) 的线粒体基因组全序列.序列全长为16 891 bp, 包括13 个蛋白质编码基因、2 个rRNA 基因和22 个tRNA 基因.除大部分基因由重链编码外,仅1个蛋白编码基因和8个tRNA基因由轻链编码.碱基组成的偏好与其他脊椎动物线粒体DNA接近.没有发现长的基因间隔区,说明该基因组的结构十分紧凑.基因组的组成与典型脊椎动物的相近,即没有发现重排、基因或控制区的重复等在其它有鳞类动物中出现过的异常特征.除单性生殖的壁虎外,现有的壁虎类线粒体基因组在基因含量和顺序上是一致的.作为蜥虎属线粒体基因组全序列的惟一代表,该序列有望在有鳞类系统发生的推断上发挥一定的作用.  相似文献   

7.
利用Illumina和Pacbio测序技术对扬子鳃蛭(Ozobranchus jantseanus)线粒体基因组全序列进行测序及注释,并与NCBI数据库中蛭纲(Hirudinea)其他物种的线粒体全序列的排列方式和系统进化关系进行了比较,以确定其系统学地位.结果显示:获得的线粒体基因组序列长度为14 868 bp,蛋白编码基因存在2种起始密码子,分别为ATG和ATT;终止密码子共有4种,分别为TAA,TAG,TA和T;蛭纲10个物种的线粒体基因组全序列基因排序可分为2种类型,其差异表现在tRNAs的互换和长非编码区的长度的不同;扬子鳃蛭所属的吻蛭目(Rhynchobdellida)均为b型,绝大部分无吻蛭目(Arhynchobdellida)的排列方式为a型.基于蛭纲物种的13个蛋白编码基因(PCGs)的Neighbor-Joining(NJ)树进化分析显示,扬子鳃蛭与其他吻蛭目物种聚类.  相似文献   

8.
统计分析了不同细胞器基因组转录的非编码RNAs(non-coding RNAs,ncRNAs)的kmer频数、约化后的碱基组分、结构-序列模式中三联体偏好.并以上述三种特征提取方法分别构成特征向量表示ncRNA序列,利用支持向量机,对四类细胞器基因组转录的ncRNAs的序列进行识别.分析两种不同的碱基约化方式发现,嘌呤/嘧啶约化(MN约化)更能反应不同细胞器基因组转录的ncRNAs的序列信息;考虑结构和碱基种类的结构-序列模式(stru-seq mode)中的三联体短片段(k=3),揭示出ncRNA与编码蛋白质的mRNA或蛋白质相互作用可能存在局域结构三联体偏好.在Jackknife检验下,预测总精度最高达到83.10%.采用不同参数的预测结果表明,结构-序列模式(stru-seq mode)中的短片段(k=3)结构有助于不同细胞器基因组转录的ncRNAs区别.  相似文献   

9.
粘质沙雷氏菌抗铜基因的克隆及性质研究   总被引:2,自引:0,他引:2  
 通过构建粘质沙雷氏菌KMR-3菌株的基因组DNA文库,克隆到了与该菌的铜抗性相关的基因,并对其部分特性进行了研究.结果表明克隆到的铜抗性基因所编码的蛋白属于CutF蛋白,由194个氨基酸编码,与莫氏耶尔森氏菌(Yersinia mollaretii)ATCC43969抗铜脂蛋白NlpE同源性最高,达到70%,并对该基因的调控序列(启动子、终止子、SD序列及转录起始位点)进行了分析.  相似文献   

10.
为揭示球状轮藻叶绿体全基因组的特征以及探究其在轮藻科内的系统发育关系,本研究基于高通量测序技术对其叶绿体全基因组进行组装和序列分析.结果表明:球状轮藻叶绿体基因组全长180 652 bp, GC含量26.6%,具有典型的四分体环状结构,与普生轮藻十分类似;球状轮藻叶绿体基因组共注释出137个基因,其中包括94个蛋白质编码基因、37个tRNA基因和6个rRNA基因,比无色丽藻多2个蛋白质编码基因和3个tRNA基因,与高等植物相比具有rpl12、trnL(gag)、rpl19、ycf20四个特殊基因;球状轮藻叶绿体全基因组共检测出87个SSR位点且绝大部分由A和T构成;此外,球状轮藻共包含24 989个密码子且密码子使用更偏好A和T,亮氨酸(Leu)是编码氨基酸最多的密码子;通过邻近法(NJ)对包括球状轮藻在内的5个种的叶绿体全基因组构建系统发育树显示,球状轮藻的亲缘关系与普生轮藻更为接近.本研究对球状轮藻叶绿体全基因组进行了解析,利用现有数据确立其系统发育学地位.  相似文献   

11.
根据U2nRNA基因的保守性和结构特点设计引物,通过PCR法扩增U2snRNA连锁基因间区的DNA片段并进行顺序分析,证实在水稻中至少存在一组U2snRNA连锁基因。对水稻总DNA的PCR分析结果表明,水稻中可能还存在其他形式的连锁基因。PCR方法可以有效地应用于结构保守基因的连锁分析中。  相似文献   

12.
基于EF1-a基因对常见禾本科作物的聚类分析   总被引:1,自引:0,他引:1  
基于EF1-a基因核苷酸序列和氨基酸序列,利用分子进化遗传分析软件MEGA 5.0构建常见禾本科植物的最小进化法(ME)、邻接法(NJ)和算术平均数的非加权成组配对法(UPGMA)分子系统进化树.研究结果表明,EF1-a cDNA序列和氨基酸序列的聚类分析都能够反映所列禾本科植物的属间关系,3种进化树的聚类分析分支情况基本一致.基于EF1-a基因的cDNA序列和氨基酸序列构建的ME、NJ树适合用来研究禾本科作物种间或种内的遗传关系,而构建的氨基酸序列UPGMA树有待更多的数据研究.  相似文献   

13.
大鼠已公布的microRNA(miRNA) 数量明显少于小鼠及人miRNA的数量.本文采用同源搜索的计算方法预测大鼠新的miRNA.从miRBase数据库中下载已知动物的pre- miRNAs, 在UCSC数据库中对大鼠的全基因组序列进行了Blat分析,并根据miRNAs的筛选标准,获得45条新的大鼠miRNAs;随后随机选取其中的9条新miRNAs进行RT- PCR实验验证,发现大部分miRNAs在脑、心、肺、肾、肌肉、脾、睾丸和肝8种组织中均有表达.在此基础上,对预测的新miRNAs进行了miRNA成簇分析和miRNA基因家族分析.  相似文献   

14.
多个禾本科物种全基因组测序的相继完成为禾本科植物基因组物理和遗传结构进化历史的研究提供了前所未有的良好机遇。以五个禾本科物种为研究对象,利用基因同源共线性方法对其基因组进行了比对分析,获得了物种的同源信息,并根据同源信息结合基因组同源结构分析,确定了物种基因组内和基因组间的同源染色体片段。比较分析同源染色体对上重复DNA片段之间的分子距离,初步揭示了禾本科植物同源染色体对间趋同进化规律,研究结果有助于理解染色体结构受非正常遗传重组影响的进化机制。  相似文献   

15.
Linux平台下EST序列分析系统的构建应用实例   总被引:2,自引:0,他引:2  
利用抑制削减杂交和基因芯片技术获得一批黄孢原毛平革菌特异表达的SET序列,使用Phrap、EMBOSS、B1ast、GENSCAN、MZEF软件,基于Linux操作系统,构建EST序列分析系统,完成了从EST和基因组Blast数据库的构建,载体序列的去除,EST序列的分类和组装,EST序列在基因组上的定位,外显子和内含子的识别以及基因预测,并通过使用perl语言结合bioperl模块写的脚本程序使分析过程自动化,从而可以快速地对大批EST序列进行分析,为克隆相关基因及研究黄孢原毛平革菌功能基因组学提供有用的信息。  相似文献   

16.
响叶杨(杨属)叶绿体基因组测序与比较分析   总被引:1,自引:0,他引:1  
本研究中,我们对响叶杨的叶绿体基因组进行测序和组装,并将其与杨属其他11个叶绿体基因组进行比较分析.结果表明,响叶杨叶绿体基因组全长158,591bp,其中两个反向重复序列区(IR)长度均为27,667bp,长单拷贝序列区(LSC)和短单拷贝序列区(SSC)长度分别为84,634和18,623bp.通过对杨属12个物种的叶绿体基因组进行比较,只发现了6个相对较大的插入缺失,因此整体而言,杨属的叶绿体基因组结构是高度保守的.系统发育分析结果显示,杨属中12个物种组成了3个具有高支持率的进化支,响叶杨与其他白杨组物种聚为一支,并且与银白杨的亲缘关系最近.本研究基于叶绿体基因组数据揭示了杨属的进化历史,将有助于进一步开展杨属植物基于叶绿体DNA序列数据的群体遗传学及其他分子生态学研究.  相似文献   

17.
18.
人类基因组计划中的DNA序列图谱是生命科学和基因工程中的伟大成就,要解译隐藏在基因组中的生物信息还有一段很长的路要走,这是因为DNA序列的结构很难分析和识别.作者提出一种用于DNA序列结构分析的特征抽取方法.这种方法采用DNA序列码序的共生概率来抽取高维特征.然后采用相关法和/或贝叶斯分类器来分类结构模式.一些仿真试验的结果表明这种方法适合于DNA序列的结构分析。  相似文献   

19.
基于GenBank构建的外显子内含子数据库(EID)含有大量的冗余数据.为了解决冗余问题,构建了基于RefSeq的非冗余EID(non-redundant EID).RefSeq是由NCBI staff负责维护和更新的参考序列库,为基因组注释、基因识别、基因突变、多态性分析、表达研究和比对分析提供了一个稳定的参考.该EID可用于大规模分析Exon/Intron结构和内含子剪切(Splicing)的研究,并拥有一些内部机制来控制数据质量和可能出现的错误.同时,它的新的改进是增加了基因序列中非翻译区(UTR)的数据内容.该文对构建基于RefSeq的非冗余EID的一些技巧作出说明.  相似文献   

20.
RNA secondary structure has become the most exploitable feature for ab initio detection of non-coding RNA(nc RNA) genes from genome sequences. Previous work has used Minimum Free Energy(MFE) based methods developed to identify nc RNAs by measuring sequence fold stability and certainty. However, these methods yielded variable performances across different nc RNA species. Designing novel reliable structural measures will help to develop effective nc RNA gene finding tools. This paper introduces a new RNA structural measure based on a novel RNA secondary structure ensemble constrained by characteristics of native RNA tertiary structures. The new method makes it possible to achieve a performance leap from the previous structure-based methods. Test results on standard nc RNA datasets(benchmarks) demonstrate that this method can effectively separate most nc RNAs families from genome backgrounds.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号