首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 921 毫秒
1.
用离散量方法预测细胞凋亡蛋白的亚细胞位置   总被引:2,自引:0,他引:2  
细胞凋亡蛋白的亚细胞位置与它的功能紧密相联.基于一个凋亡蛋白的亚细胞位置主要决定于它的氨基酸序列这一观点,提出了一种新的预测凋亡蛋白亚细胞位置的算法——离散量方法.计算了蛋白质一级序列中紧邻残基对的出现个数,作为离散源中的参数,利用离散增量极小化对四类凋亡蛋白进行定位预测.采用Zhou和Doctor使用的数据库,通过Re-sub-stitution检验和Jack-knife检验方法,离散量方法比他们使用的协变判别式算法总体预测成功率分别高1.0%和12.2%;采用我们自己整理的扩大以后的数据库,通过Re-substitution检验和Jack-knife检验方法,总体预测成功率分别为88.1%和78.1%.  相似文献   

2.
根据革兰氏阴性菌蛋白不同亚细胞位置、其一级结构中氨基酸含量、氨基酸的关联性及亲疏水性的不同,利用最小离散增量的方法,分别以20个氨基酸组份、400个氨基酸二联体组份及氨基酸亲疏水性在蛋白质上的分布为参数构成离散源,对革兰氏阴性菌蛋白的5类亚细胞定位进行预测,分别用self—consistency方法和Jack-knife方法预测,均取得了较高的预测成功率.  相似文献   

3.
用离散量方法预测蛋白质亚细胞定位   总被引:2,自引:2,他引:2  
根据蛋白质的亚细胞定位,将蛋白质分为四类,用离散量的数学理论,提出了预测蛋白质的亚细胞定位理论方法,利用蛋白质中氨基酸组分,通过计算离散增量和离散有限系数预测蛋白质的亚细胞定位,用self—consistency和Jackknife两种方法测试均获得较高的预测成功率。结果表明:蛋白质类中包含的蛋白质数越多,预测成功率越高。  相似文献   

4.
一种预测蛋白质结构型的新方法   总被引:2,自引:0,他引:2  
基于蛋白质的结构类型决定于它的二级结构序列的概念 ,将蛋白质的二级结构含量和二级结构序列参数 Nα,Nβ,Nβαβ结合起来构成离散源 ,分别计算四种结构类型的标准离散量 D( Xα) ,D( Xβ) ,D( Xα/β) ,D( Xα β) ,利用离散增量的概念 ,蛋白质的结构类型是由这个蛋白质的离散量 D( X)与四个标准离散量之间离散增量的最小值所决定的 .因此 ,对标准集中 35 9个蛋白的结构型进行检测并对检验集中 1 1 7个蛋白质进行结构预测 ,标准集的准确率为 87% ,检验集的预测准确率为 88%  相似文献   

5.
将拟南芥基因组全序列,按内含子、外显子及基因间序列区分为三类.在统计分析的基础上,选取21种三联体的概率,作为信号参数,并以这些参数分别构建内含子、外显子和基因间序列的离散源,计算了离散量.某区间上任意一段序列的类型是由其离散量D(X)与同一区间上的三个标准离散量D(Xe)、D(Xi)和D(Xs)之间的离散增量的最小值决定的.由此实现了用离散量对三种核苷酸序列类型的预测,预测结果表明:标准集准确率达到84.26%,检验集达到84.64%.  相似文献   

6.
线粒体是很重要的半自主性细胞器,主要为细胞提供能量,还承担了许多其他生理功能,而线粒体的某些功能只有在特定亚线粒体位置中才能实现.对亚线粒体定位的研究有助于进一步了解蛋白质的功能.文章计算了蛋白质的进化信息、同源序列的go信息、氨基酸指数信息、氨基酸粘性、氨基酸组分、平均化学位移,并结合mRNA序列的三联体频数,利用支持向量机算法和离散增量算法对蛋白质亚线粒体定位进行预测,在jackknife检验下准确率达到97.64%,同时用独立检验也取得较好的结果.  相似文献   

7.
蛋白质亚细胞定位是当前生物信息学和蛋白质科学的重要研究领域,本研究从蛋白质一级序列出发,取伪氨基酸组成向量作为输入数据,运用支持向量机作为预测工具,对人类12类蛋白质亚细胞的定位进行预测,得到独立检验的结果为85.2%,Jack knife 检验的结果为80.6%;结果显示,用较简单的预测方法,得到了较好的预测结果.  相似文献   

8.
把基因组中的内含子、外显子和基因间序列分为三类序列,从这些序列中取64种三核苷的重复出现次数作为离散源的状态参数,计算三类序列的标准离散量,比较待测序列的离散量与三个标准离散量之间的离散增量值,由离散增量的最小值决定待测序列属于哪一类.本文用离散增量方法对线虫和酵母序列进行预测,结果表明,对酵母内含子预测的敏感性为81.5%,对外显子预测的敏感性为88.5%、特异性为99.6%,对基因间序列预测的敏感性为65.4%、特异性为87.5%;若以在相同长度区间的序列为标准离散源,预测相应长度区间的序列,对线虫内含子的预测的敏感性为82.2%、特异性为94.2%,对外显子预测的敏感性为91.1%、特异性为97.5%,对基因间序列预测的敏感性为78.8%。  相似文献   

9.
基于传统的以20种氨基酸在蛋白质序列中的组分来预测蛋白质亚细胞定位的方法,运用了"离散小波变换"(Discrete Wavelet Transform,DWT)的数字信号处理技术,对蛋白质序列中氨基酸排序的特征进行提取,并与氨基酸百分组成相结合,对蛋白质亚细胞定位进行了预测.通过观察预测结果发现,引入氨基酸的排列顺序特征后,蛋白质亚细胞定位的预测正确率有了显著的提高.  相似文献   

10.
基于离散增量和协变判别函数识别蛋白质亚核定位   总被引:1,自引:0,他引:1  
利用离散增量结合协变判别函数,选取氨基酸组份和N端氨基酸二肽组份为信息参数,对蛋白质亚核定位进行预测.在序列相似性小于等于25%时,406个单定位亚核蛋白Jackknife检验总预测成功率为75.9%,相关系数CC为0.644,把多定位亚核蛋白作为独立测试集,92个多定位亚核蛋白总预测成功率为78.3%.在序列相似性小于等于65%时,504个单定位亚核蛋白Jackknife检验总预测成功率为75.6%,相关系数CC为0.643,92个多定位亚核蛋白总预测成功率为80.4%.与 Lei等人利用Lei-SVM方法对该数据库预测结果相比,单定位亚核蛋白总预测成功率比Lei等人高9.1%,CC值比Lei等人高0.124,多定位亚核蛋白总预测成功率比Lei等人高15.2%.  相似文献   

11.
样地间多样性指数的差异显著性如何检验,C.R.Rao给出了一种APDIV方法,但在生态学的工作中,常常由于采样作不到个体随机而造成多样性指数及其分配的估计有偏,本文给出一种可减少偏性的APDIV的刀切估计法,并报告应用于长白山土壤动物螨类分析的结果。  相似文献   

12.
摆脱目前常用的基于特征模体来识别超家族的方法,引入单个氨基酸的物理化学性质(亲疏水性质)及其在氨基酸序列中的分布特征参数(分段的方法),利用最小离散增量算法对属于同一结构类的不同超家族进行了识别,总预测成功率令人满意.选取了全α类、全β类、α β类、α/β类中的各4个超家族分别进行了识别.对全α类的4个超家族,se lf-cons istency检验和jack-kn ife检验可达83.0%,81.2%;对全β类的4个超家族,两种检验均为80.9%;对α β类的4个超家族,两种检验总成功率最高分别为88.6%,88.0%;识别α/β类的4个超家族时两种检验的结果分别为69.3%和67.6%.  相似文献   

13.
鄂东大别山生物多样性研究   总被引:3,自引:0,他引:3  
对鄂东大别山区的生物多样性进行了研究.目前已知该区有维管植物195科663属1 461种,占湖北省总种数的24.27%和全国总种数的5.25%,属国家特有、珍稀濒危或重点保护的植物有34种,有苔藓植物30科64属143种.已知该区有陆生脊椎动物26目65科208种,占湖北省总种数的31.04%和全国总种数的8.09%,其中有27种国家重点保护野生动物和61种湖北省级重点保护动物.该区自然植被类型有10个植被型,52个群系.该区不仅动植物区系成分多样性复杂,而且经济类型多样.  相似文献   

14.
根据最近的SCOP库,依据2616个蛋白质结构域折叠类型的分类和PDB库中这些蛋白质的主二级结构序列,计算了这些蛋白质中α螺旋、β折叠和βαβ片段单元的数目,并以此为主要参数构成信息离散源,用离散量方法预测了这些蛋白结构域的折叠类型.结果表明,运用各种不同标准集和检验集,得到α类、β类、α/β类和α β类蛋白质结构域的预测成功率均在99%,92%,89%和87%以上.对标准集总的平均预测成功率为93.82%,对检验集总的平均预测成功率为94.35%.  相似文献   

15.
借助于任意两个样品之间的差异度和有序样品的全差异矩阵的概念,提出有序样品聚类的全差异矩阵法.聚类数和分割点可以容易地获得.通过例子说明了全差异矩阵法是简单、有效和准确的。  相似文献   

16.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号