首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
基于Brogaard等2012年给出的酵母全基因组单碱基精度的核小体定位图谱,从中提取出酵母基因组全部的核小体中心序列和连接序列.计算k-mer(k取4、5、6和8)在两类序列中的相对频率,分析两类序列中k-mer的使用差异.按照k-mer相对使用频率对数增序的方式排列模体,得到两类序列k-mer相对频率对数比的分布.结果显示模体长度越长两类序列的使用差异越明显,当k>7以后差异分布逐渐稳定.按照中心序列8-mer相对频率增序的方式排列模体,发现在相对频率小于0.5的区域,两类序列的8-mer使用差异显著.分别计算了7个抽样点附近中心序列偏好的8-mer和连接序列偏好的8-mer的G+C含量和二核苷含量.结果显示两类序列模体的G+C含量随着相对频率的增大而逐步减小,中心序列更加偏好GC和CG二核苷,而连接序列更加偏好GG二核苷和CC二核苷.这些主要的差异特征与实验分析结果一致.  相似文献   

2.
以大肠杆菌K-12的启动子(Promoter)序列作为正集,编码区(Coding区)和基因间汇聚区(CON区)的序列作为两组对照负集建立数据库,分别对实验上确定的165条σ38、94条σ54及600条σ70启动子序列进行二联体位点的保守性分析,得到保守性参数随位点的涨落.用单种柔性结构参数分别和各集的二联体位置关联权重矩阵构成对序列的打分函数,分别对三类数据集进行了检验.研究发现,在自洽检验中,算法对σ38、σ54启动子的预测准确性都达到98%,对σ70启动子的预测准确性也达到了88%.通过绘制ROC曲线,确定了三类数据集的十交叉检验的最佳阈值,该算法在最佳阈值下对σ38、σ70两类启动子的预测准确度(Ac)都达到了80%以上,其中算法对以σ70启动子序列为正集、编码区序列为负集的数据集(记为Prom-Coding数据集)的Ac为88%,而对以σ54启动子序列为正集、基因间汇聚区序列为负集的数据集(记为Prom-CON数据集)的Ac为76%、Prom-Coding数据集的Ac为87%.使用Jackknife法对σ38、σ54两类数据集进行检验,Ac都达到了80%以上.  相似文献   

3.
核小体结合模体集合的理论预测对于全面了解核小体的定位和染色质重塑以及DNA序列的结构和进化具有重要的意义.以人类1号染色体基因间序列为样本,研究了8-mer相对模体数随频次分布的三峰现象.发现依照8-mer中CG二核苷含量分类,三个8-mer子集(记为iCG,i=1,2,3)形成独立的单峰分布,而依照其它15种二核苷含量分类则没有此现象.分析DNA序列的这一独特结构后,提出一个理论猜想,即含1CG的模体就是核小体结合模体集合.为了验证这一猜想,提取了1CG 8-mer中偏好和稀有的三核苷,分别构建了核小体特征参数Ktri(O)和Ktri(R),得到它们在基因转录起始序列(TSS)上的分布,将两类分布分别与实验给出的核小体占据率分布做线性拟合.统计结果显示,1177个TSS序列中,置信度大于95%的序列占到总数的89.2%,置信度大于99%的序列占到总数的81.6%.结果验证了1CG模体集合就是核小体结合模体的猜想.  相似文献   

4.
植物miRNAs前体的生物信息分析   总被引:2,自引:0,他引:2  
miRNAs前体(pre-miRNAs)是产生成熟miRNAs的基因表达产物,能形成较为稳定的发卡环结构,具有较低的最小折叠自由能(minimal folding free cnergy,MFE)。在对植物pre-miRNAs长度、不同碱基含量、MFE、熵分析基础上,重点比较不同RNAs序列之间MFE与其长度的比值(MFEL)。结果表明MFEL是区分植物pre-miRNAs的一个很有效的参数:pre-miRNAs的MFEL值平均为-45.98kcal/mol,明显低于mRNAs(-23.08kcal/mol),tRNAs(-22.13kcal/mol)和rRNAs(-16.83kcal/mol)。使用MFEL参数可提高预测植物miRNAs基因的效率。  相似文献   

5.
泽泻rDNA ITS区序列特征及其居群鉴别研究   总被引:4,自引:0,他引:4  
运用PCR产物直接测序法对川泽泻、建泽泻和江泽泻的rDNA ITS区(包括ITS1,5.8S,ITS2)碱基序列进行了序列测定和分析.泽泻rDNA ITS区的碱基序列总长度确定为640 bp,江泽泻和建泽泻的ITS区碱基序列完全一致,川泽泻与建泽泻(江泽泻)在rDNA ITS区碱基序列有2个稳定的变异位点,分别位于ITS1和ITS2区段.我国的泽泻与意大利泽泻在5.8S保守区(第289位)有一个碱基差异.依据泽泻rDNA ITS区的序列特征可以进一步鉴别川泽泻和建泽泻,为泽泻居群的鉴别提供可靠的分子标记.  相似文献   

6.
利用生物信息学方法在产黄青霉基因组中筛选微卫星序列,并对其基因组中微卫星数量和丰度进行了研究.利用SSRHunter1.3软件在长度为30 090 464 bp的产黄青霉基因组中共找到163个微卫星序列.其中以两碱基重复类型数目最多,为133个,占重复序列总数目的 81.60%;其次是三碱基重复为29个,占17.79%;最后是四碱基1个,占0.61%.在两碱基重复序列中,AT(44.79%)重复类别最多,其次是AG(23.92%).在三碱基重复序列中,共发现9种重复类别,其中以AAG和ACT重复类型最多,为6个(3.68%),其次是ACC(2.45%),最少的是AGC(0.61%).四碱基重复中,只有1种重复类别,为ATGT(0.61%).同时选取二碱基的重复次数在7以上和三碱基的重复次数在6以上的微卫星序列,利用Primer Premier 5.0软件设计了引物,共得到30对引物.本研究不仅为后续产黄青霉微卫星标记的筛选奠定了基础,也丰富了其基因组学资源,对产黄青霉的种群遗传结构分析、分子标记选育和遗传多样性有重要意义.  相似文献   

7.
采用生物素探针(GATA)8杂交和磁珠富集法直接从长薄鳅基因组中分离出了一批四碱基重复微卫星DNA,并对其序列特征进行了分析.随机挑取200个单克隆进行筛选,得到175个阳性单克隆(87.5%).测序发现共有117个阳性克隆含有微卫星重复单元.通过序列比对,排除重复测的序列后,得到91条重复类型和重复次数不同微卫星的序列,其中含四碱基重复的微卫星有62条.与探针相同或互补(GATA/CTAT)n的四碱基重复微卫星位点数最多,此外,还检测到其它的四碱基重复类型,如(AGAC/TCTG)n、(AAGA/TTCT)n、(GATG/CTAC)n,以及(CT)n+(ATAG)n和(AT)n+(ATAG)n二碱基和四碱基复合型微卫星位点.获得的长薄鳅基因组四碱基重复微卫星位点中,属于完美型的最多,有30条(48.4%),其次为复合型,有29条(46.8%),非完美型的有3条(4.8%).大多数的四碱基微卫星(31条)重复次数为10~19次,占50.0%,其次为20~29次和5~9次四碱基重复,均为22.6%,30次以上的四碱基重复较少,仅有3条(4.8%).  相似文献   

8.
成都麻羊NSTN基因的克隆测序   总被引:2,自引:1,他引:2  
根据得克萨斯山羊MSTN基因序列设计引物,并进行PCR扩增,克隆成都麻羊肌肉生成抑制素(MSTN)基因exon1、部分intron1、exon2、部分intron2、exon3及部分intron3,通过DNAman生物软件分析获得MSTN完全编码序列.研究结果,成都麻羊MSTN编码序列含1128个碱基,编码含375个氨基酸的蛋白,编码序列最后三个碱基为终止密码子.exon1全长372bp,翻译第1~124个氨基酸;exon2全长375bp,翻译第125~249个氨基酸;exon3全长381bp,翻译第250~375个氨基酸.成都麻羊MSTN基因exon1变异程度最大,次之为exon2,exon3变异程度最小.  相似文献   

9.
对实验证实的683条大肠杆菌sigma70启动子的序列进行保守性计算分析,获得四个保守的区域:-10区域是启动子最保守的功能元件,-35区域、转录起始位点附近及启动子上游UP单元.从保守区中选取M 6(1)值较大的10个保守位点的六联体频数作为参数、引入伪计数构建位置权重矩阵,利用位置关联打分函数对683条sigma70启动子进行预测.负集分别从编码区和非编码区选取700条序列进行算法检验,获得很好的结果,敏感性分别为91%和90%.进而利用位置关联打分函数对大肠杆菌整条序列进行搜索,获得1567条预测序列.这些序列可能是实验未测定的启动子序列.  相似文献   

10.
miRNA前体(pre-miRNAs)是产生成熟miRNAs的基因表达产物,能够形成较为稳定的茎—环(stem-loop)结构.为了深入研究miRNAs,对miRNAs前体的二级结构建模,并采用关联规则识别miRNAs基因在进化过程中的结构模式.通过分析产生的结构—类别关系(structure-category relationships)来探索miRNAs的功能特征和调节机制.为了获得较好的实验结果,改进传统的关联规则挖掘算法,应用支持度约束和频繁项集的聚类来优化数据挖掘结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号