首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
UTR区中的内含子对基因的表达调控过程发挥着重要的作用,它通过与相应mRNA的序列匹配方式发生相互作用并实现对基因的表达调控。采用Smith-Waterman算法进行局域比对,获得UTR区中的内含子与相应mRNA序列之间的最佳匹配片段。分析6个物种mRNA序列上最佳匹配片段的序列特征及匹配频率的分布规律,并分析这种相互作用分布的普适性。结果发现:最佳匹配片段的配对率和平均长度分布与siRNA和miRNA的结合特征一致; UTR区中的内含子与相应mRNA序列上的UTR序列存在较强的相互作用,低GC片段倾向与3′UTR区作用,而高GC片段倾向结合到5′UTR区。结论表明最佳匹配片段的序列特征符合RNA-RNA相互作用的一般规律,内含子序列应该是一类调控基因表达的功能片段。UTR区中的内含子与mRNA序列是协同进化的,通过相互作用完成应有的功能。  相似文献   

2.
日本囊对虾(Marsupenaeus japonicus)基因组微卫星特征分析   总被引:3,自引:0,他引:3  
通过建立随机基因组文库和序列测序,对日本囊对虾基因组进行了较大规模的微卫星分布特征分析.在1606711bp的随机基因组序列中,共找到1206个微卫星序列,其序列总长度约占测序序列总长度的5.9%.微卫星序列中,以两核苷酸重复的序列数目最多,约占微卫星总数的69.82%,三核苷酸重复次之,约占12.35%.两核苷酸重复中以AT重复最为丰富,约占两核苷酸重复序列总数的29.44%.微卫星在低拷贝区间(≤42)数量相对较大,约占比例为72.31%.重复单位拷贝数的变异能力分析表明,变异系数最大的前3种重复类型,均为4—6核苷酸,较长重复单位类型有着较强的变异能力.微卫星重复单位长度与其拷贝数的相关分析表明,二者呈负相关(r=-0.428),即随着重复单位长度的增加,其拷贝数在减少.两核苷酸重复4种类型和三核苷酸重复10种类型基序AT含量与重复序列数目的相关分析表明,随着重复类型基序AT含量的增加,其相应的序列数目增多.同时,微卫星各重复类型基序GC含量在0—70%间时,两端侧翼序列GC含量与之存在着正相关关系.这可能意味着微卫星两端的侧翼序列的碱基组成对微卫星的产生和进化有一定的影响.以上结果为物种间微卫星分布频率和丰度的比较、微卫星标记开发以及微卫星进化和功能的研究等工作提供基础.  相似文献   

3.
植物启动子识别是真核启动子识别中的重要研究领域.针对目前植物启动子识别算法的特异性较低的问题,提出了一种基于GC碱基偏好分析和支持向量机(SVM)的植物启动子识别算法.首先通过对GC含量的分析将DNA序列分类为GC偏好序列和非GC偏好序列,然后进行结构特征和信号特征的提取,最后通过SVM分类器进行启动子识别.SVM分类器由四个SVM子分类器组成,即启动子-3’UTR子分类器,启动子-5’UTR子分类器,启动子-Intergenics子分类器和启动子-CDS子分类器.实验结果表明,该算法比其他算法具有更高的特异性,对植物启动子识别具有积极意义.  相似文献   

4.
研究了组分约束下的随机 DNA序列中 ORF数目、ORF的长度与随机序列总长度和GC含量之间的关系 .结果表明 ,ORF数目的对数与 ORF的长度之间存在很好的线性关系 ;ORF的最大长度随序列长度的增加而变长 ,ORF的总数与序列长度成正比 ;ORF的总数目随着 GC含量的增加明显减少 ;随着 GC含量的增加 ,长度较短的 ORF数目相对减少 ,长度较长的 ORF数目相对增加 ;随着序列长度的增加 ,长度较短的 ORF相对增多 .  相似文献   

5.
统计分析了爱滋病病毒全序列中中间间隔S从0到100、侧翼序列长度L从4开始的所有回文结构,通过分析不同S、L的回文结构的频数以及AT含量,发现回文结构的AT含量普遍高于全序列的AT含量.有三种辅助蛋白(Vif、Vpu、Nef)存在于病毒颗粒内,我们找出编码这三种蛋白的DNA序列,并统计出它们的回文结构,分析它们的AT含量及回文数密度(平均每1000个碱基中包含的回文数),并与丙型肝炎病毒序列回文结构进行对比.发现编码Vpu (HIV-1特有的蛋白)蛋白序列的回文结构在AT含量,和回文数密度方面均显示其特性.由此推测高AT含量的回文结构在HIV-1中起到重要作用.  相似文献   

6.
研究成熟mRNA序列与其相应内含子序列的相互作用规律对于揭示基因表达调控具有重要意义.本文以黑腹果蝇第一号染色体蛋白质编码基因序列为研究对象,采用SmithWaterman局域比对的方法,在mRNA序列和内含子序列之间进行匹配性比对分析.研究发现剪切后的内含子序列与基因的5′UTR序列和3′UTR序列的相对匹配频数高于编码(CDS)序列.最佳匹配片段集合的G+C含量分布范围很广,其分布中心与3′UTR序列最为接近,5′UTR序列次之,距离CDS序列最远,这是导致两端UTR序列与内含子序列有较高匹配强度的原因.最佳匹配片段的配对率主要分布在68%~75%之间,最可几长度为20bp左右,最佳匹配片段的序列特征与miRNA相似.结果显示内含子与mRNA之间的这种匹配模式是参与基因调控的一种可能方式.  相似文献   

7.
为了解鸡SH3RF2基因的结构与功能,由NCBI数据库获得鸡SH3RF2基因的mRNA和氨基酸序列数据信息,利用NCBI/Blast软件进行序列分析、同源性比对确定鸡SH3RF2基因的3’UTR区序列。在此基础上,利用公共数据库和相关软件对SH3RF2基因的CDS(coding sequence)区和其3’UTR(untranslated region)区进行了MicroRNA靶标的预测分析,进一步利用生物信息学相关数据库对其蛋白理化性质和一级结构进行分析,模拟了其二级结构和空间结构并构建了SH3RF2蛋白的系统进化树。  相似文献   

8.
CRISPR-Cas系统是新近在原核生物中发现的一种抵御外来DNA入侵的免疫机制,由一个成簇规则间隔的短回文重复序列(CRISPR)和附属的蛋白质(Cas)组成,广泛分布于真细菌和古菌中.CRISPR由重复序列及其间隔序列组成,间隔序列来自于过去的入侵DNA,并插入到细菌的CRISPR排列中.一旦出现新的入侵,CRISPR转录,其RNA经过加工后与Cas蛋白质组成一个核蛋白复合体,该复合体通过RNA与入侵DNA序列之间的互补配对,结合目标序列,最后Cas蛋白质将入侵DNA降解.此外,基于CRISPR系统中的Cas9蛋白,发展了一种新的基因组编辑技术,在不同的细胞中均能获得高效的基因定点打靶,展现出巨大的潜力.  相似文献   

9.
以粳稻日本晴基因组DNA和Cot-1 DNA为探针,分别对日本晴、籼稻广陆矮4号和普通野生稻的染色体组进行了基因组原位杂交(GISH)和Cot-1 DNA荧光原位杂交(FISH)分析,并对3种染色体组进行了同源聚类和比较研究.结果表明:粳稻基因组DNA和Cot-1 DNA探针信号在3种水稻染色体组中的分布状况和覆盖率相似,Cot-1 DNA的覆盖率分别为(47.13±0.18)%、(45.89±0.22)%、(44.24±0.21)%,3种水稻基因组同源性高,亲缘关系接近.Cot-1 DNA在3种水稻染色体上的杂交信号分布各有特点,中高度重复序列的变异在普通野生稻向栽培稻进化和亚洲栽培稻籼、粳分化过程中具有重要意义,中高度重复序列含量较低的2、5、8号染色体是水稻染色体组进化过程中相对活跃的成分.  相似文献   

10.
选取家鼠基因组中核糖核蛋白基因序列作为研究对象,采用Smith-Waterman局域比对法研究了内含子序列之间的相互匹配特征。结果表明,大多数第一内含子的长度分布在98 bp左右,第一内含子GC含量大多分布在43%~45%之间。第一内含子与其他相应内含子最佳匹配片段的长度多集中在27 bp左右,其GC含量约为58%,且最佳匹配片段的匹配率达到75%以上。进一步分析发现,不同GC含量的最佳匹配片段在第一内含子中的相对位置呈现出不同的分布规律。  相似文献   

11.
响叶杨(杨属)叶绿体基因组测序与比较分析   总被引:1,自引:0,他引:1  
本研究中,我们对响叶杨的叶绿体基因组进行测序和组装,并将其与杨属其他11个叶绿体基因组进行比较分析.结果表明,响叶杨叶绿体基因组全长158,591bp,其中两个反向重复序列区(IR)长度均为27,667bp,长单拷贝序列区(LSC)和短单拷贝序列区(SSC)长度分别为84,634和18,623bp.通过对杨属12个物种的叶绿体基因组进行比较,只发现了6个相对较大的插入缺失,因此整体而言,杨属的叶绿体基因组结构是高度保守的.系统发育分析结果显示,杨属中12个物种组成了3个具有高支持率的进化支,响叶杨与其他白杨组物种聚为一支,并且与银白杨的亲缘关系最近.本研究基于叶绿体基因组数据揭示了杨属的进化历史,将有助于进一步开展杨属植物基于叶绿体DNA序列数据的群体遗传学及其他分子生态学研究.  相似文献   

12.
统计了SARS病毒全序列中间间隔S从0到100、侧翼序列长度L从4开始的所有回文结构,并从AT含量及频数分布等方面分析了不同区域(编码及非编码区域等)回文结构的特征,同时,找出SARS病毒及其它几种冠状病毒各蛋白编码序列,并统计出它们中的回文结构,分析它们的回文特征,发现了一些SARS病毒序列中回文结构的分布规律,如L大于7的回文主要分布在编码区;绝大部分编码蛋白序列的回文结构数密度小于整个SARS病毒序列回文结构数密度等.  相似文献   

13.
MicroRNA是调控基因表达的重要功能片段,它们在动植物的生长发育、疾病发生过程中发挥着重要的作用。基于miRecords数据库,以人类、小鼠和大鼠实验验证的miRNA和它们的靶mRNA 3′UTR序列为研究对象,分析了miRNA和其匹配片段在3′UTR序列上的位置偏好性。研究发现,miRNA与3′UTR序列相互作用的位置存在区域偏好。低G+C含量的miRNA主要作用在3′UTR序列的5′端和3′端,高G+C含量的miRNA主要作用在3′UTR序列的5′端。低G+C含量的匹配片段在3′UTR序列上没有明显的位置偏好,而高G+C含量的匹配片段集中分布在3′UTR序列的5′端。低配对率的匹配片段主要分布在3′UTR序列的两端,中等配对率的匹配片段主要分布在3′UTR序列的5′端。此外,还分析了miRNA与匹配片段的4种相互作用方式中配对率的差异。研究对于揭示miRNA对基因表达调控的多样性提供了新的思路。  相似文献   

14.
总结了序列编码区的统计特征。1.信息参致(?)X对进化的依赖;2.关联长度的分布;3.子序列参数的特异性;4.编码区长度与进化水平无关;5.重复区长度的冻结现象;6.重复片段具有大的D_f和偏置的GC含量。为了解释这些特征,本文提出假设:生命形成伊始,有一个序列长度的突涨阶段一一序列(编码区)在较短的时间内,通过重复,拼接而迅速变长。当序列达到了一定长度以后,才开始以碱基突变和选择为主的阶段,以及真核以后的内含子插入机制阶段。  相似文献   

15.
以拟南芥、葡萄和水稻3种植物的基因序列为研究样本,采用Smith-Waterman算法进行局域比对后,获得mRNA序列和相应内含子序列之间的最佳匹配片段.然后分析了mRNA序列上最佳匹配片段序列特征及匹配频率的分布规律,同时分析了这种相互作用分布的保守性.研究发现,UTR区与内含子存在较强的相互作用,低GC片段倾向与3...  相似文献   

16.
本文研究了细菌的蛋白质多肽组分统计特征与基因组GC(Guanine+Cytosine)含量的相关性,发现当多肽长度较小时多肽组分特异性与GC含量存在着很强的关联;随着多肽长度增加,上述关联发生突变,关联迅速丧失.这一结果表明,基于组分特异性确定细菌亲缘关系的方法的确给出了不同于GC含量的信息,从而能实现有效分类.  相似文献   

17.
质体DNA向核基因组转移能够形成核质体DNA,核质体DNA序列的插入是推动动植物基因组及染色体组演化的重要动力.但是核质体DNA的插入和植物性染色体起源及演化之间的关系仍不清楚.以雌雄异株植物菠菜为材料,利用基因组消减杂交技术筛选分离菠菜雌雄基因组差异的NUPTs序列,并进行验证和分析.结果表明,从构建的菠菜消减杂交文库中共得到39条长度为75~308 bp的雌雄差异序列,其平均长度约为154 bp.对获得的序列进行Blastn同源比对发现了12条序列为叶绿体基因组来源序列,这些序列与菠菜叶绿体基因组相似度在98%以上,说明所获得的差异片段为核质体DNA序列.将筛选出的核质体DNA序列进行进一步验证后获得了两个稳定的长度分别为146 bp和199 bp的雄性偏好核质体DNA序列,说明所获得的两个NUPTs序列在菠菜雄性基因组中有更多的累积.  相似文献   

18.
在所分析的5'UTR序列中约19%的序列在阅读框1下含有AUG,约22%和24%的序列分别在阅读框 2 和阅读框3下含有 AUG,而在 3'UTR序列当中,无论是在哪个阅读框下,约71%含有AUG.这些AUG绝大多数都是以小ORF的形式出现的;分析小ORF序列以及与它们相应的IC序列(阅读框间序列)长度,发现虽然3'UTR序列远远长于5'UTR序列,但是它们所包含的小ORF长度几乎没有差距,只是平均来说每一条3'UTR序列所包含的小ORF数量明显多于每一条5'UTR序列所包含的小ORF数量,而且dIC(下游阅读框间序列)比uIC(上游阅读框间序列)长很多,平均长50个碱基;第二类IC序列(UTR区相邻的两个阅读框之间的序列)的平均长度比其它两类IC序列(UTR区最后一个阅读框之后的序列)的平均长度小,而且又含有相对较多的终止密码;比较uORF序列与dORF序列密码子使用偏好的CAI值发现,尽管相差不大,但是无论在哪个阅读框下,uORF序列的CAI值都显著高于dORF序列的CAI值.  相似文献   

19.
几种基于基因组DNA的真菌分类技术研究进展   总被引:6,自引:0,他引:6  
基于基因组DNA的真菌分类技术发展迅速。综述了DNA分子杂交技术,真菌线粒体DNA限制性片段长度多态性(m t RFLP)分析,随机扩增多态性DNA(RAPD)分析,rDNA序列分析,扩增片断长度多态性(amp lifiedfragm ent length polymorph ism,AFLP)在真菌分类和系统发育中的应用。  相似文献   

20.
基于Brogaard等2012年给出的酵母全基因组单碱基精度的核小体定位图谱,从中提取出酵母基因组全部的核小体中心序列和连接序列.计算k-mer(k取4、5、6和8)在两类序列中的相对频率,分析两类序列中k-mer的使用差异.按照k-mer相对使用频率对数增序的方式排列模体,得到两类序列k-mer相对频率对数比的分布.结果显示模体长度越长两类序列的使用差异越明显,当k>7以后差异分布逐渐稳定.按照中心序列8-mer相对频率增序的方式排列模体,发现在相对频率小于0.5的区域,两类序列的8-mer使用差异显著.分别计算了7个抽样点附近中心序列偏好的8-mer和连接序列偏好的8-mer的G+C含量和二核苷含量.结果显示两类序列模体的G+C含量随着相对频率的增大而逐步减小,中心序列更加偏好GC和CG二核苷,而连接序列更加偏好GG二核苷和CC二核苷.这些主要的差异特征与实验分析结果一致.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号