首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
研究了组分约束下的随机 DNA序列中 ORF数目、ORF的长度与随机序列总长度和GC含量之间的关系 .结果表明 ,ORF数目的对数与 ORF的长度之间存在很好的线性关系 ;ORF的最大长度随序列长度的增加而变长 ,ORF的总数与序列长度成正比 ;ORF的总数目随着 GC含量的增加明显减少 ;随着 GC含量的增加 ,长度较短的 ORF数目相对减少 ,长度较长的 ORF数目相对增加 ;随着序列长度的增加 ,长度较短的 ORF相对增多 .  相似文献   

2.
选取家鼠基因组中核糖核蛋白基因序列作为研究对象,采用Smith-Waterman局域比对法研究了内含子序列之间的相互匹配特征。结果表明,大多数第一内含子的长度分布在98 bp左右,第一内含子GC含量大多分布在43%~45%之间。第一内含子与其他相应内含子最佳匹配片段的长度多集中在27 bp左右,其GC含量约为58%,且最佳匹配片段的匹配率达到75%以上。进一步分析发现,不同GC含量的最佳匹配片段在第一内含子中的相对位置呈现出不同的分布规律。  相似文献   

3.
采用克隆测序的方法,测定8种蜘蛛抱蛋属植物的核糖体DNA的内转录间隔区(ITS)序列,加上1种从GenBank查得的ITS序列,经对位排列后有218个位点是变化的,其中91个位点对于简约分析是有效的信息位点.序列GC的含量相对较高,GC的含量在66.1%~75.4%之间,使得蜘蛛抱蛋属植物的ITS区序列的测定存在一定困难.对于蜘蛛抱蛋属的分子系统学研究,ITS区是一段很有价值的DNA片段。  相似文献   

4.
植物启动子识别是真核启动子识别中的重要研究领域.针对目前植物启动子识别算法的特异性较低的问题,提出了一种基于GC碱基偏好分析和支持向量机(SVM)的植物启动子识别算法.首先通过对GC含量的分析将DNA序列分类为GC偏好序列和非GC偏好序列,然后进行结构特征和信号特征的提取,最后通过SVM分类器进行启动子识别.SVM分类器由四个SVM子分类器组成,即启动子-3’UTR子分类器,启动子-5’UTR子分类器,启动子-Intergenics子分类器和启动子-CDS子分类器.实验结果表明,该算法比其他算法具有更高的特异性,对植物启动子识别具有积极意义.  相似文献   

5.
本文研究了细菌的蛋白质多肽组分统计特征与基因组GC(Guanine+Cytosine)含量的相关性,发现当多肽长度较小时多肽组分特异性与GC含量存在着很强的关联;随着多肽长度增加,上述关联发生突变,关联迅速丧失.这一结果表明,基于组分特异性确定细菌亲缘关系的方法的确给出了不同于GC含量的信息,从而能实现有效分类.  相似文献   

6.
总结了序列编码区的统计特征。1.信息参致(?)X对进化的依赖;2.关联长度的分布;3.子序列参数的特异性;4.编码区长度与进化水平无关;5.重复区长度的冻结现象;6.重复片段具有大的D_f和偏置的GC含量。为了解释这些特征,本文提出假设:生命形成伊始,有一个序列长度的突涨阶段一一序列(编码区)在较短的时间内,通过重复,拼接而迅速变长。当序列达到了一定长度以后,才开始以碱基突变和选择为主的阶段,以及真核以后的内含子插入机制阶段。  相似文献   

7.
生命是一个进化的信息系统.本文分析了核酸序列作为生命的原型在存储和传递信息中的特征,指出生命信息的‘载波’是随机序列或独立序列,讨论了从中提取信息的问题,得到了信道容量定理,着重分析了镶嵌保守区的随机序列信道和{D_l}统计信道.  相似文献   

8.
首次对刺纹车轮虫(Trichodina centrostrigata Basson,Van AsPaperna,1983)进行了18SrDNA的克隆测序并分析,研究结果显示:刺纹车轮虫是一种具有辐射状中央颗粒的淡水车轮虫,具有相对较高的GC含量而位于分子系统树的顶枝,它与海水环境中的车轮虫具有较高的序列相似性及较近的遗传距离从而聚为一枝。研究提示刺纹车轮虫具有较强的宿主适应性,在系统进化中分化较晚并与海水种类具有较近的亲缘关系;此外,车轮虫的同源性与18S rDNA序列相似性、遗传距离具明显相关性,GC含量与分子支序树分枝具有明显相关性。  相似文献   

9.
在粒子输运Monte Carlo程序中广泛采用线性同余法随机数发生器。为了改善该发生器产生的随机数序列的统计品质,该文基于洗牌法思想设计了一种新的随机数发生器。在新算法中,以原线性同余法随机数发生器的中间整型变量为基础,通过位操作来构造实现洗牌效果所需的随机整型变量。由于位操作的计算量较少,使得新算法在计算量上不会有明显的增加。而统计检验的结果表明,该方法对随机数序列统计品质的改善是显著的。同时,该文还阐述了新算法在并行环境中的应用。  相似文献   

10.
改进线性同余法随机数发生器   总被引:4,自引:0,他引:4  
在粒子输运Monte Carlo程序中广泛采用线性同余法随机数发生器。为了改善该发生器产生的随机数序列的统计品质,该文基于洗牌法思想设计了一种新的随机数发生器。在新算法中,以原线性同余法随机数发生器的中间整型变量为基础,通过位操作来构造实现洗牌效果所需的随机整型变量。由于位操作的计算量较少,使得新算法在计算量上不会有明显的增加。而统计检验的结果表明,该方法对随机数序列统计品质的改善是显著的。同时,该文还阐述了新算法在并行环境中的应用。  相似文献   

11.
首次对刺纹车轮虫(TrichodinacentrostrigataBasson,VanAs & Paperna, 1983)进行了 18S rDNA 的克隆测序并分析,研究结果显示:刺纹车轮虫是一种具有辐射状中央颗粒的淡水车轮虫,具有相对较高的 GC 含量而位于分子系统树的顶枝,它与海水环境中的车轮虫具有较高的序列相似性及较近的遗传距离从而聚为一枝。研究提示刺纹车轮虫具有较强的宿主适应性,在系统进化中分化较晚并与海水种类具有较近的亲缘关系;此外,车轮虫的同源性与 18S rDNA序列相似性、遗传距离具明显相关性,GC 含量与分子支序树分枝具有明显相关性。
  相似文献   

12.
为降低基因剪接位点识别算法复杂度和计算量,根据剪接位点上下游序列的保守特性及碱基组成随位点邻近序列GC含量变化等统计特征,建立Takagi-Sugeno模糊模型.通过模型输出值和阈值比较,判断真实的剪接位点.基于模糊似然函数的模糊聚类算法确定模型结构和前件参数,并结合最小二乘法完成该模型后件参数的识别.仿真结果表明,该算法简单,可使模糊模型的结构辨识和参数辨识同时完成,从而实现模糊模型的快速识别;能够很好地提取剪接位点附近保守序列的统计特征,为剪接位点的识别提供一种新的方法.  相似文献   

13.
内含子序列通过与相应mRNA序列的匹配参与基因表达调控。采用Smith-Waterman局部比对方法,以拟南芥全基因组基因序列为基础,获得了内含子序列与其对应的外显子连接序列的最佳匹配片段。为了揭示两者之间的序列匹配特征,给出匹配频率在外显子序列上的分布。研究发现,匹配频率分布在外显子的边界存在显著差异,长内含子序列和第一个内含子序列对外显子连接序列的分布偏好明显区别于其他内含子序列。对于长片段、低GC含量以及高配对率的最佳匹配片段在外显子连接序列上游EJC(exon-exon junction complex)结合区域分布有明显的最小值。结果显示内含子序列和编码序列存在共同进化关系。  相似文献   

14.
为了提高长非编码RNA(long non-coding RNA,lncRNA)预测的准确性,提出一种基于随机森林算法的lncRNA预测方法.在国际通用的基因注释和基因组序列训练数据集中,首先进行特征选取,然后采用随机森林算法对包含特征信息的数据集进行模型训练.选取的特征包含14种三聚核酸序列(ACG、CCG、CGA、CGC、CGG、CGT、CTA、GCG、GGG、GTA、TAA、TAC、TAG、TCG)的占比、终止密码子在3种阅读框中的数量标准差、GC含量、蛋白质编码能力、转录本长度、外显子个数、平均外显子长度和保守性分值.10折交叉验证结果表明,该预测方法在真阳性率、精确率、召回率、F值和AUC值等性能指标方面均优于其他算法.  相似文献   

15.
本文在最新的致癌基因核酸序列数据库的基础上,对各258个致癌基因序列的密码子使用频数进行统计,并且分析统计结果,认为翻译的选择、变异和碱基成分可能是造成致癌基因序列的密码子使用偏好的主要原因。  相似文献   

16.
考虑到在计算 H I值时 ,任何一种碱基在序列中出现的理论频数都应该大于 5 ,故而对原 H I公式进行了约化处理 ,并将约化后的 H I值与原 H I值作了对比 ,发现不同的约化方式所得到的 H I值在描述序列不均匀性时的效果是不同的 ,用编码区所偏好的约化语言进行约化后所得到的 H I值在应用于高 GC含量、中 GC含量以及总共的外显子和内含子的识别时 ,其效果要优于原 H I值  相似文献   

17.
本文研究了252个核酸序列(编码区)的长度大于5的重复片段,发现重复区长度约占序列长的一半,重复片段的出现次数和总长与进化没有相关性,但与信息剩余量 D_1有一定的相关性,并且重复片段的结构(D’1)与序列的进化也有一定的统计相关性.  相似文献   

18.
为了研究极大节旋藻气囊蛋白的分子生物学特性,并为gvpA基因的研究提供基础材料,在对极大节旋藻GSS序列分析的基础上,采用PCR技术克隆了gvpA基因的全长序列,并进行了相关分析。结果表明极大节旋藻gvpA基因编码区的GC含量为42.92%,核苷酸序列和蛋白序列与Planktothrix agardhii的gvpA基因相似性最高(79.4%,97.2%),其次是Pseudanabaena sp.PCC6901(75.3%,94.4%)。系统发生分析表明极大节旋藻gvpA基因与Planktothrix agardhii的gvpA基因同源性最高(89%ML,85%MP,89%NJ)。  相似文献   

19.
核酸序列的矩阵表示   总被引:2,自引:2,他引:0  
提出了用矩阵形式一对一地表示核酸序列的方法.发现通过矩阵运算很容易得到描述核酸序列中单碱基出现概率和碱基相关出现概率的矩阵和值,并且很易推广到多个碱基关联的情况.对于核酸序列的编码区,用这种矩阵方法计算出密码子的使用频率.而且发现用矩阵方法比较核酸序列的同源性非常直观.  相似文献   

20.
回文序列是与基因表达调控、DNA复制和重组密切相关的重要DNA模体.回文的功能直接决定其在基因组中的丰度和分布,关于回文丰度和分布的信息从而促进回文的功能研究.文章研究回文在黑腹果蝇基因组中的分布规律.结果发现:(1)在不同类型的基因组序列(如编码区、内含子、基因间区、5’UTR和3’UTR)中,回文在3’UTR中分布最密集,编码序列中的分布最少;(2)序列的碱基组分偏好性不能够完全解释回文在基因组序列中的出现频数;(3)回文的相对丰度随着回文长度的增加而增加;(4)回文序列越长,其GC含量越低.所有这些都在启示,回文的功能多样性强烈依赖于其长度和GC含量.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号