首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 283 毫秒
1.
把基因组中的内含子、外显子和基因间序列分为三类序列,从这些序列中取64种三核苷的重复出现次数作为离散源的状态参数,计算三类序列的标准离散量,比较待测序列的离散量与三个标准离散量之间的离散增量值,由离散增量的最小值决定待测序列属于哪一类.本文用离散增量方法对线虫和酵母序列进行预测,结果表明,对酵母内含子预测的敏感性为81.5%,对外显子预测的敏感性为88.5%、特异性为99.6%,对基因间序列预测的敏感性为65.4%、特异性为87.5%;若以在相同长度区间的序列为标准离散源,预测相应长度区间的序列,对线虫内含子的预测的敏感性为82.2%、特异性为94.2%,对外显子预测的敏感性为91.1%、特异性为97.5%,对基因间序列预测的敏感性为78.8%。  相似文献   

2.
模式生物的外显子、内含子和基因间序列的识别   总被引:1,自引:0,他引:1  
基于核酸序列在剪切位点上保守性、组分的不同和编码序列阅读框架的3周期性,模式生物全基因组序列分为外显子、内含子和基因间序列三类.三个标准离散源分别由64个三联体在整条序列上的概率和4个碱基序列首尾(剪切位点附近)共30个位点上的概率共同构成.某条序列的类型就由该序列的离散量同相应区间上三个标准离散量的离散增量确定.结果表明:具有184个信号参数的离散量预测比只有64个三联体参数的结果要高出5%,总体预测成功率:线虫为87.37%,拟南芥为91.08%,果蝇为92.28%,原核生物大肠杆菌的二种序列预测率为92.88%,酵母菌为94.88%.  相似文献   

3.
真核生物的全基因组序列可分为三种:外显子、内含子和基因间序列.基于剪切位点附近序列的保守性,序列的组分特征和编码序列阅读框存在三周期性,三种序列的标准离散源由序列上64个三联体的概率和5′端与3′尾剪切位点附近(共30位点)上4个碱基的概率,共184个参数构成.某条序列的类型就可以由该序列的离散量与上面三个标准离散源的离散量之间的离散增量最小值决定.当标准离散源具有184个信息参数时预测率比64参数预测的成功率至少提高4.61%,前者的预测成功率依次如下:线虫88.37%,酵母菌90.72%,拟南芥91.08%,果蝇92.28%,大肠杆菌92.88%.对预测成功的和错误的两类序列进行比较,发现这些预测错误序列的184个参数值与其预测结果所属的那类序列本身的参数值十分类似.  相似文献   

4.
将拟南芥(A.tha liana)和线虫(C.eleg ans)的基因序列中的外显子按第一外显子,中间外显子和最后外显子划分成三类.分别将外显子/内含子剪切位点、翻译起始和终止位点附近的三联体的3个位点作为3条子链,以各条子链的不同碱基个数作为离散源参数,共12个离散源参数,计算各类外显子离散量.用离散增量实现了对三种序列类型的预测,预测成功率都达到80%以上;并且统计了剪切位点附近的碱基相对频数,结果比较了由于三联体所取位置及个数不同而造成的对预测结果的差异,说明了剪切位点附近碱基的保守性.  相似文献   

5.
用离散量预测原核生物蛋白质的亚细胞位置   总被引:5,自引:2,他引:5  
基于不同亚细胞位置中蛋白质的氨基酸组成及序列信息不同这一观点,以单个氨基酸含量及两两组合氨基酸含量为信息构成离散源,分别计算了原核生物蛋白质三类亚细胞位置的标准离散量D(Z),D(Xp),D(Xc).利用离散增量的概念预测蛋白质的亚细胞位置,它是由这个蛋白质的离散量D(X)与三个标准离散量D(Xc),D(Xp),D(Xc)之间离散增量的最小值所决定的.采用Self—consistency检验和Jack—knife检验方法,给出了选择五组不同信息作为离散源中参数时的预测结果.与现有的方法比较,发现用Jack—knife检验法预测extracellular类蛋白质时,给出的离散量方法能够给出最好的预测性能,结果也表明提取更多有效的序列信息是提高预测精度的关键.  相似文献   

6.
一种预测蛋白质结构型的新方法   总被引:2,自引:0,他引:2  
基于蛋白质的结构类型决定于它的二级结构序列的概念 ,将蛋白质的二级结构含量和二级结构序列参数 Nα,Nβ,Nβαβ结合起来构成离散源 ,分别计算四种结构类型的标准离散量 D( Xα) ,D( Xβ) ,D( Xα/β) ,D( Xα β) ,利用离散增量的概念 ,蛋白质的结构类型是由这个蛋白质的离散量 D( X)与四个标准离散量之间离散增量的最小值所决定的 .因此 ,对标准集中 35 9个蛋白的结构型进行检测并对检验集中 1 1 7个蛋白质进行结构预测 ,标准集的准确率为 87% ,检验集的预测准确率为 88%  相似文献   

7.
用离散量方法预测细胞凋亡蛋白的亚细胞位置   总被引:2,自引:0,他引:2  
细胞凋亡蛋白的亚细胞位置与它的功能紧密相联.基于一个凋亡蛋白的亚细胞位置主要决定于它的氨基酸序列这一观点,提出了一种新的预测凋亡蛋白亚细胞位置的算法——离散量方法.计算了蛋白质一级序列中紧邻残基对的出现个数,作为离散源中的参数,利用离散增量极小化对四类凋亡蛋白进行定位预测.采用Zhou和Doctor使用的数据库,通过Re-sub-stitution检验和Jack-knife检验方法,离散量方法比他们使用的协变判别式算法总体预测成功率分别高1.0%和12.2%;采用我们自己整理的扩大以后的数据库,通过Re-substitution检验和Jack-knife检验方法,总体预测成功率分别为88.1%和78.1%.  相似文献   

8.
基于人类9种细胞系和15种组织的单碱基精度的甲基化数据,计算了基因范围六个功能区域(转录起始区域、第一外显子、中间外显子、最后外显子、内含子和转录终止区域)的甲基化水平,分析了各功能区域甲基化的分布.采用离散增量和欧式距离两类参数分别计算了细胞系和组织间的基因的甲基化差异,并对具有较高差异水平的前20个基因在六类细胞系的表达进行了分析.  相似文献   

9.
内含子序列“三碱基组”的信息分析   总被引:2,自引:0,他引:2  
在对编码序列的碱基分布作大量统计分析的基础上,对内含子序列中G、C的分布作了统计分析.发现内含子在“三碱基组”的意义下,第一位上(G+C)含量占优势.如果将同一基因的外显子三联密码和内含子“三碱基组”做比较,发现在内含子中出现而外显子中没有的那些三碱基组,它们大多属于Lió所列出的“非偏爱”密码  相似文献   

10.
根据外显子在密码子三个位点上的分布不均匀性 ,引入非均匀指标 H I,来研究线虫基因外显子与内含子的序列特征 .通过推广 H I参数 ,定义干涉指标 R,对外显子和内含子的多个片段的特征进行研究 ,得到了 R值分布以及与外显子和内含子片段的关系 .  相似文献   

11.
西藏马线粒体DNA D-loop区的遗传多样性   总被引:1,自引:0,他引:1  
对西藏拉萨和泽当两个地区23匹西藏马的线粒体DNA控制区(mtDNA D-loop)部分片段进行序列分析, 检测出16个单倍型, 包括32个核苷酸多态性位点(其中转换位点31个, 缺失位点1个), 占所分析位点总数的9.27%. 单倍型多样性(h)和核苷酸多样性(π)分别为0.93±0.04和2.51%±0.16%, 表明西藏马的遗传多样性较丰富. 基于23匹西藏马序列以及现代欧亚马群的mtDNA序列, 进行了系统发育分析和多维尺度分析. 结果表明, 西藏马在母系遗传关系上与近东、 中亚以及欧洲家马有较近的亲缘关系, 与东亚的蒙古马以及韩国马亲缘关系较远.  相似文献   

12.
采用样方调查法对临沂蒙山国家森林公园龟蒙顶植物群落物种多样性及群落特征进行研究。结果表明,4个样方(共1 600 m2)中,记录到维管植物43种,隶属18科31属。4个群落垂直结构明显,可划分为乔木层、灌木层和草本层,主要物种分别为栓皮栎、荆条和鸭跖草。从物种多样性指数的平均值来看,物种丰富度(S)、多样性(H′)、均匀度(E)和优势度(D)基本表现由大到小的顺序为草本层、灌木层、乔木层。但4个样方相同层次的物种多样性有一定差异。建议重点保护植物优势物种,同时加强群落物种多样性的发展,促进蒙山国家森林公园龟蒙顶植物群落发挥生态功能。  相似文献   

13.
采用ISSR技术对拟穴青蟹(Scylla paramamosain)3个地理群体:福建群体(FJ)、广西防城港群体(FC)和北海群体(BH)的遗传多样性进行检测。用10对ISSR引物对90个个体进行PCR扩增,用POPGENE32计算遗传参数,并用ARLEQUIN软件进行AMOVA分子变异分析。结果共检测到63个位点,多态位点数为56。福建、防城港和北海群体Nei's基因多样性指数(He)分别为0.2670、0.1819和0.2257,Shannon's信息指数(I)分别为0.3945、0.2708和0.3371,遗传多样性水平从高到低依次为FJ〉FC〉BH。He和I在群体水平上分别为0.2248和0.3341,在物种水平上分别为0.3186和0.4337。拟穴青触32.34%的变异发生在群体间,67.66%的变异发生在群体内,3个群体间的遗传分化系数为0.1542,产生了一定的遗传分化。  相似文献   

14.
棉花种质资源多样性的ISSR聚类分析及主成分分析   总被引:1,自引:0,他引:1  
利用ISSR分子标记对48份棉花种质资源的亲缘关系及遗传多样性进行分析,结果显示,筛选出的10个ISSR引物扩增出的112条带中,多态性条带占101条,为总条带的90.18%.每个引物均可扩增4~21个多态性位点,平均10.10个,引物平均多样性信息指数(PIC)和多态性谱带百分率(PPB)分别为0.76和87.88%.利用NT-SYSpc 2.1统计分析软件中的UPMGA法对48份棉花种质资源构建亲缘关系树状图,在遗传相似性系数(GS)为0.66水平上可将所有参试材料聚成两大类,且与主成分分析(PCA)结果基本吻合.ISSR标记揭示出这48份棉花种质资源遗传多样性较小,遗传基础比较狭窄.  相似文献   

15.
章报道了乌鲁木齐市生境不同的3所高等院校内节育肢动物多样性的研究结果,应用物种丰富度模型、Shannon-Wiener指数、Simpson指数以及均匀性指数等分析了3个生境中物种的丰富度和多样性。结果表明新疆农业大学校内节肢动物物种组成为丰富型,新疆石油学院和新疆师范大学节肢动物物种组成虽都为较多型,但前的物种多样性指数明显低于后。  相似文献   

16.
Based on the concept of the pseudo amino acid composition(PseAAC),protein structural classes are predicted by using an approach of increment of diversity combined with support vector machine(ID-SVM),in which the dipeptide amino acid composition of proteins is used as the source of diversity.Jackknife test shows that total prediction accuracy is 96.6% and higher than that given by other approaches.Besides,the specificity(Sp) and the Matthew’s correlation coefficient(MCC) are also calculated for each protein structural class,the Sp is more than 88%,the MCC is higher than 92%,and the higher MCC and Sp imply that it is credible to use ID-SVM model predicting protein structural class.The results indicate that:① the choice of the source of diversity is reasonable,② the predictive performance of ID-SVM is excellent,and ③ the amino acid sequences of proteins contain information of protein structural classes.  相似文献   

17.
以福建建瓯万木林自然保护区核心区保护完整的常绿阔叶林(forest in conservedarea,C)和地处同镇,生境基本一致,曾受人为严重破坏的吴大源村和七道村的常绿阔叶林(forest with human-caused disturbance,D)为对象,分析人为干扰对建瓯常绿阔叶林群落物种多样性的影响。研究表明,C群落与D群落物种丰富度分别为69.3和78.7,差异明显。D群落物种多样性的增加是因为灌木、草本及藤本植物所占比例较C群落增多所致。群落各层次的Shannon-Wiener指数及其均匀度计算表明,人为干扰对群落上层物种多样性影响较大,D群落高大乔木待恢复。D群落经过多年封山育林,由于种类入侵和竞争,正在形成物种更为丰富的当地典型地带性植被类型。该结果表明一定程度的人为干扰与封山育林相结合,可能是维持甚至增加群落物种多样性的有效手段。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号