首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
UTR区中的内含子对基因的表达调控过程发挥着重要的作用,它通过与相应mRNA的序列匹配方式发生相互作用并实现对基因的表达调控。采用Smith-Waterman算法进行局域比对,获得UTR区中的内含子与相应mRNA序列之间的最佳匹配片段。分析6个物种mRNA序列上最佳匹配片段的序列特征及匹配频率的分布规律,并分析这种相互作用分布的普适性。结果发现:最佳匹配片段的配对率和平均长度分布与siRNA和miRNA的结合特征一致; UTR区中的内含子与相应mRNA序列上的UTR序列存在较强的相互作用,低GC片段倾向与3′UTR区作用,而高GC片段倾向结合到5′UTR区。结论表明最佳匹配片段的序列特征符合RNA-RNA相互作用的一般规律,内含子序列应该是一类调控基因表达的功能片段。UTR区中的内含子与mRNA序列是协同进化的,通过相互作用完成应有的功能。  相似文献   

2.
MicroRNA是调控基因表达的重要功能片段,它们在动植物的生长发育、疾病发生过程中发挥着重要的作用。基于miRecords数据库,以人类、小鼠和大鼠实验验证的miRNA和它们的靶mRNA 3′UTR序列为研究对象,分析了miRNA和其匹配片段在3′UTR序列上的位置偏好性。研究发现,miRNA与3′UTR序列相互作用的位置存在区域偏好。低G+C含量的miRNA主要作用在3′UTR序列的5′端和3′端,高G+C含量的miRNA主要作用在3′UTR序列的5′端。低G+C含量的匹配片段在3′UTR序列上没有明显的位置偏好,而高G+C含量的匹配片段集中分布在3′UTR序列的5′端。低配对率的匹配片段主要分布在3′UTR序列的两端,中等配对率的匹配片段主要分布在3′UTR序列的5′端。此外,还分析了miRNA与匹配片段的4种相互作用方式中配对率的差异。研究对于揭示miRNA对基因表达调控的多样性提供了新的思路。  相似文献   

3.
以拟南芥、葡萄和水稻3种植物的基因序列为研究样本,采用Smith-Waterman算法进行局域比对后,获得mRNA序列和相应内含子序列之间的最佳匹配片段.然后分析了mRNA序列上最佳匹配片段序列特征及匹配频率的分布规律,同时分析了这种相互作用分布的保守性.研究发现,UTR区与内含子存在较强的相互作用,低GC片段倾向与3...  相似文献   

4.
选取线粒体核糖体蛋白基因序列为样本,采用Smith-Waterman方法,通过局部比对得到了每个物种基因的第一内含子与其它内含子序列之间的最佳匹配片段。以此为基础,分析了第一内含子序列特征及其与同基因中其它内含子的相互匹配特性。结果显示:大多数线粒体核糖体蛋白基因的第一内含子长度小于200 bp,且在40 bp处出现峰值。其GC含量分布接近于正态分布且在0.40处出现最高频率。最佳匹配片段的GC含量大多数集中在0.2到0.5之间。最佳匹配片段的配对率在60%处出现峰值,也有部分达到100%。把最佳匹配片段按照GC含量的高低分组后,发现不同GC含量组的最佳匹配片段在第一内含子中的相对位置的分布具有明显差异,说明片段的GC含量很可能在内含子之间相互作用中起着关键性的作用。研究结果表明,这些最佳匹配片段可能与某些生物学功能元件密切相关。  相似文献   

5.
剪切后的内含子对基因的表达调控过程仍发挥着重要的作用,发现内含子通过与相应mRNA的相互作用来实现这些功能的.用改进后的Smith-Waterman算法进行局域比对,对线虫、果蝇、小鼠和人类的线粒体上核糖核蛋白基因的内含子与相应编码序列做匹配性比对分析,发现内含子的中部序列与编码序列存在较强的相互作用,三类内含子上的匹配频率分布显示了各自的特征.在编码序列上有多个最佳匹配区域和禁配区域,推测这些禁配区域可能是蛋白质复合体的结合区域.最佳匹配片段的GC含量分布范围较广,覆盖了其它三类序列分布范围.高等真核生物最佳匹配片段的平均长度比低等真核生物要长一些.结论表明最佳匹配片段的序列特征符合RNA-RNA相互作用的一般规律,内含子应该是一类调控基因表达的功能片段.  相似文献   

6.
内含子序列通过与相应mRNA序列的匹配参与基因表达调控。采用Smith-Waterman局部比对方法,以拟南芥全基因组基因序列为基础,获得了内含子序列与其对应的外显子连接序列的最佳匹配片段。为了揭示两者之间的序列匹配特征,给出匹配频率在外显子序列上的分布。研究发现,匹配频率分布在外显子的边界存在显著差异,长内含子序列和第一个内含子序列对外显子连接序列的分布偏好明显区别于其他内含子序列。对于长片段、低GC含量以及高配对率的最佳匹配片段在外显子连接序列上游EJC(exon-exon junction complex)结合区域分布有明显的最小值。结果显示内含子序列和编码序列存在共同进化关系。  相似文献   

7.
选取家鼠基因组中核糖核蛋白基因序列作为研究对象,采用Smith-Waterman局域比对法研究了内含子序列之间的相互匹配特征。结果表明,大多数第一内含子的长度分布在98 bp左右,第一内含子GC含量大多分布在43%~45%之间。第一内含子与其他相应内含子最佳匹配片段的长度多集中在27 bp左右,其GC含量约为58%,且最佳匹配片段的匹配率达到75%以上。进一步分析发现,不同GC含量的最佳匹配片段在第一内含子中的相对位置呈现出不同的分布规律。  相似文献   

8.
为了克隆盘羊与巴什拜羊杂交后代短鄂、肺及鼻咽上皮细胞克隆1(SPLUNC1)基因cDNA全长序列,本研究根据GenBank上已公布的牛、山羊的SPLUNC1基因序列来设计简并引物,以盘羊与巴什拜羊杂交F1代为材料,克隆出盘羊与巴什拜羊杂交后代SPLUNC1基因的片段序列,再利用RACE法克隆其SPLUNC1基因3′端和5′端,测序后拼接获得SPLUNC1基因全长cDNA序列。结果显示,盘羊与巴什拜羊杂交后代SPLUNC1基因的cDNA全长为1117 bp,5′非编码区(UTR)为84 bp,3′UTR为265 bp,开放阅读框(ORF)为768 bp,编码255个氨基酸。预测该基因编码蛋白的等电点5.006,分子量26.57 kDa。系统进化分析表明,盘羊与巴什拜羊杂交后代SPLUNC1氨基酸序列与绵羊的氨基酸序列同源性最高。本研究克隆了盘羊与巴什拜羊杂交后代SPLUNC1基因全长cDNA序列,为后续深入研究该杂交后代SPLUNC1基因的功能奠定基础。  相似文献   

9.
采用RLM-RACE法,根据已获得的盐角草胆碱单加氧酶基因的部分序列,设计2条特异性嵌套PCR引物,成功地克隆了该基因cDNA 5′末端全序列,测序结果显示该片段包括5′UTR 154个核苷酸和编码区606个核苷酸,编码N端202个氨基酸,Blast P结果表明,该片段编码的蛋白序列与辽宁碱篷及其他藜科植物的胆碱单加氧酶同源性达到85%以上,同时找出了其转录起始位点,即为该序列的第1个碱基g.  相似文献   

10.
MHC class II invariant chain-like proteins(ICLP)因子与免疫反应密切相关,其参与对抗原的处理,保证多肽不被进一步降解为氨基酸.通过RACE反应获得赤点石斑鱼ICLP2cDNA全序列,全长1 837 bp,包括44 bp的5′UTR区,861 bp的开放阅读框以及932 bp的3′UTR区.编码286个氨基酸,推测的蛋白质分子量为31 878 u.对赤点石斑鱼10个组织的ICLP2基因进行PCR扩增和测序,结果表明赤点石斑鱼ICLP2基因的表达不存在组织特异性.此外,氨基酸序列同源比对的结果表明,赤点石斑鱼与其它16种脊椎动物ICLP2的相似度在25%~78%之间,与狼鲈和鳜鱼ICLP2因子的同源程度最高,分别为78%和74%.根据ICLP的氨基酸序列构建的脊椎动物系统进化树,表明了该分子的氨基酸序列可以作为研究鱼类物种间进化关系的良好指标.  相似文献   

11.
讨论了L1在人类染色体中的分布密度与染色体长度以及L1的密度与基因密度之间的关系.发现在大多数染色体上L1的密度和染色体的长度表现为正相关,而L1的密度和染色体中基因的密度表现为负相关;对人类L1的5′UTR进行了详细的研究后,发现在L1元件的5′UTR部分含有许多转录因子结合位点.对基因的转录起始位点上游进行统计分析,发现其中含有大量的L1序列.通过对人类的EST数据库进行BLAST分析,新发现了51条和人类L1 5′UTR相似性较高的EST片断,根据它们分布的组织特异性,说明L1元件可能调控与发育过程有关的基因的表达;最后应用多样性增量的方法对人类和大鼠的L1 5′UTR进行了区分,得到了较好的预测结果,说明大部分L1的5′UTR的调控作用是人类特有的.  相似文献   

12.
回文序列是与基因表达调控、DNA复制和重组密切相关的重要DNA模体.回文的功能直接决定其在基因组中的丰度和分布,关于回文丰度和分布的信息从而促进回文的功能研究.文章研究回文在黑腹果蝇基因组中的分布规律.结果发现:(1)在不同类型的基因组序列(如编码区、内含子、基因间区、5’UTR和3’UTR)中,回文在3’UTR中分布最密集,编码序列中的分布最少;(2)序列的碱基组分偏好性不能够完全解释回文在基因组序列中的出现频数;(3)回文的相对丰度随着回文长度的增加而增加;(4)回文序列越长,其GC含量越低.所有这些都在启示,回文的功能多样性强烈依赖于其长度和GC含量.  相似文献   

13.
夏威夷椰子超氧化物歧化酶基因片段的克隆与序列分析   总被引:2,自引:0,他引:2  
以热带植物夏威夷椰子(Chamae doreacostricana)基因组DNA为模板,根据SOD基因保守序列设计特异引物进行PCR扩增,得到特异基因片段.回收该基因片段,与pMD182T载体连接,并转化到感受态大肠杆菌ER2566细胞,获得Cu*Zn-SOD基因片段的克隆.序列分析表明夏威夷椰子Cu*Zn-SOD基因片段含3个外显子和3个内含子,编码64个氨基酸,与玉米、红薯和白杨相应氨基酸序列的同源性分别为82.81%,81.25%,81.25%和79.69%.  相似文献   

14.
含有CHROMO(chromatin organization modifier)结构域的蛋白参与了染色质结构的调节.本研究从嗜热四膜虫(Tetrahymena thermophila)全基因数据库(www.ciliate.org)和基因表达数据库(tged.ihb.ac.cn)中筛选到有性生殖特异表达TCD3(Tetrahymena chromo domain-containing protein 3)基因.该基因ORF为1 005bp,大核染色体中基因全长1 241bp,含有两个内含子.5′-RACE和3′-RACE表明5′端非编码区(5′-UTR)长度为40bp,3′端非编码区(3′-UTR)长度为90bp.TCD3基因预测编码334个氨基酸构成,含有一个CHROMO结构域.CHROMO结构域聚类分析表明四膜虫Tcd3蛋白可能与线虫CeCDP功能类似,参与异染色质的形成和DNA序列删除.  相似文献   

15.
利用一对PCR引物,寡聚核苷酸序列的上游引物为5-′gCg,AAT,TCA,TCC,CAC,gTg,CCT,gC-3;′下游引物为5-′gAg,AAT,TCC,Tgg,ggA,ggg,ACC,TT-3′。经68℃退火及30轮循环的PCR程序后,分别克隆来自我国青海和云南地区牦牛的乳球蛋白基因的5′调控区1 447 bp的DNA片段。将该片段从琼脂糖凝胶中回收,克隆在pMD18-T Vector后进行序列测定。序列分析结果表明,青海牦牛该序列的核苷酸序列与文献报道的奶牛该基因的同源性为97.65%,云南牦牛该序列的核苷酸序列与奶牛该基因的同源性为96.8%,青海牦牛与云南牦牛该基因片段的核苷酸序列同源性为99.4%。  相似文献   

16.
从八肋游仆虫细胞中克隆到一种新的β-微管蛋白基因.序列分析结果表明:在大核中,该基因全长1561bp.与已经报道过的β-微管蛋白基因不同,它的5′端基因上游调控序列有49 bp,AT含量为75.5%.上游调控序列中仅有一个TATAA框,没有CCAAT框;该基因的3′端的下游调控序列有121 bp,富含AT碱基,达到86.8%,其中有明显的反向重复序列.上下游调控序列中各有一个断裂信号TTGAA和TTCAA,负责从小核到大核发育过程中大核染色体的形成.从小核基因组中克隆到相应的基因片段,比大核中的序列多7个碱基5′-CATGCTC-3′,其功能尚不清楚.序列比对表明,新的β-微管蛋白基因与已经报道的β-微管蛋白基因的同源性92.3%,阅读框中有2个氨基酸的变化,将它命名为β2-微管蛋白基因.  相似文献   

17.
利用改进的cDNA代表性差示分析(RDA)技术,从调控状态的胡萝卜体细胞胚中分离到LEA基因片段,以该片段为探针筛选调控状态的胡萝卜体细胞胚的cDNA文库及用控渗法构建的基因组文库,获得了胡萝卜LEA基因家族的一个新成员DcLEA1(GenBank注册号:AF308739).该基因转录区由5′UTR区、两个外显子、一个内含子及3′UTR构成,启动区长1.2kb;开放阅读框为480 bp,编码159个氨基酸和一个终止密码子.Northern杂交分析表明,DcLEA1基因在胡萝卜成体中无表达活性;在调控状态的胡萝卜体细胞胚中具有高表达活性;在解调控12 h的胡萝卜体细胞胚中,转录本含量急剧下降;随着解调控时间的延长,胡萝卜体细胞胚根开始延伸,DcLEA1基因的表达活性又有所增加.这一现象与LEA基因在种子休眠和萌发过程中表达活性的变化规律相似.由此推测,可以利用胡萝卜体细胞胚蔗糖调控-解调控体系,来模拟种子休眠与萌发的过程,研究植物胚根发育相关基因表达调控的分子机理.  相似文献   

18.
根据外显子在密码子三个位点上的分布不均匀性 ,引入非均匀指标 H I,来研究线虫基因外显子与内含子的序列特征 .通过推广 H I参数 ,定义干涉指标 R,对外显子和内含子的多个片段的特征进行研究 ,得到了 R值分布以及与外显子和内含子片段的关系 .  相似文献   

19.
以Homo.sapiensRefSeq作为原始数据库来构建EID(Exon/Intron Database)可以克服GenBank所带来的冗余问题.通过分析RefSeq基因组数据库中每个CDS(Coding Sequence,编码序列),获得构建EID的相关的数据(基因的定义、基因标识符、基因序列、蛋白质标识符、蛋白质序列、外显子和内含子的数量、大小、总数、非翻译区(UTR)内含子、内含子相位、内含子剪切位点模式).结果表明,人类24条染色体(22条常染色体和2条性染色体,共计2 870 827355 bps)中含有32 157个基因标识符(gene blocks),其中7 398个基因为假基因,4 014个基因发生了可变剪切(Al-ternative Splicing,AS),15 533个基因含有CDS内含子,765个基因含有UTR内含子,2 585个基因不含有内含子,其他的为异常基因.  相似文献   

20.
以南方鲇(Silurus meridionalis)为对象,运用RT-PCR和RACE技术,获得神经肽Y(Neuropeptide Ty-rosing,NPY)基因cDNA的全序列.该基因cDNA全长743bp,包括3′非编码区(UTR)373bp,5′非编码区(UTR)82bp,开放阅读框(ORF)288bp,编码95个氨基酸.与其他脊椎动物进行同源性分析发现,南方鲇NPY序列与斑点叉尾鮰(Ictalurus punctatus)的同源性最高,达79%,其次为瓦氏黄颡鱼(Pelteobagrus vachellii),同源性达76%.进化树分析也表明,南方鲇与斑点叉尾鮰和瓦氏黄颡鱼聚为一支.qPCR显示,南方鲇NPY mRNA在脑、心脏、肾脏、鳃、胃、肠和肝等7种组织中都有不同程度的表达,其中在脑中的表达量最高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号