首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 578 毫秒
1.
基于支持向量机,以全部和局部氨基酸序列的n肽组分、序列的亲疏水性分布等五种特征提取方法构成特征向量表示蛋白质序列,对六类细胞凋亡蛋白的亚细胞位置进行预测.结果表明,基于氨基酸二肽组成成分构成的特征向量集(以符号DIPE表示)的预测结果高于其它四种特征向量集的预测结果,在Jackknife检验下,总预测成功率达到了89.3%;与现有的方法比较,发现对于Mitochondrial类凋亡蛋白,支持向量机方法有更好的预测效果.  相似文献   

2.
用离散量预测原核生物蛋白质的亚细胞位置   总被引:5,自引:2,他引:5  
基于不同亚细胞位置中蛋白质的氨基酸组成及序列信息不同这一观点,以单个氨基酸含量及两两组合氨基酸含量为信息构成离散源,分别计算了原核生物蛋白质三类亚细胞位置的标准离散量D(Z),D(Xp),D(Xc).利用离散增量的概念预测蛋白质的亚细胞位置,它是由这个蛋白质的离散量D(X)与三个标准离散量D(Xc),D(Xp),D(Xc)之间离散增量的最小值所决定的.采用Self—consistency检验和Jack—knife检验方法,给出了选择五组不同信息作为离散源中参数时的预测结果.与现有的方法比较,发现用Jack—knife检验法预测extracellular类蛋白质时,给出的离散量方法能够给出最好的预测性能,结果也表明提取更多有效的序列信息是提高预测精度的关键.  相似文献   

3.
用离散量方法预测细胞凋亡蛋白的亚细胞位置   总被引:2,自引:0,他引:2  
细胞凋亡蛋白的亚细胞位置与它的功能紧密相联.基于一个凋亡蛋白的亚细胞位置主要决定于它的氨基酸序列这一观点,提出了一种新的预测凋亡蛋白亚细胞位置的算法——离散量方法.计算了蛋白质一级序列中紧邻残基对的出现个数,作为离散源中的参数,利用离散增量极小化对四类凋亡蛋白进行定位预测.采用Zhou和Doctor使用的数据库,通过Re-sub-stitution检验和Jack-knife检验方法,离散量方法比他们使用的协变判别式算法总体预测成功率分别高1.0%和12.2%;采用我们自己整理的扩大以后的数据库,通过Re-substitution检验和Jack-knife检验方法,总体预测成功率分别为88.1%和78.1%.  相似文献   

4.
用离散量方法预测蛋白质亚细胞定位   总被引:2,自引:2,他引:2  
根据蛋白质的亚细胞定位,将蛋白质分为四类,用离散量的数学理论,提出了预测蛋白质的亚细胞定位理论方法,利用蛋白质中氨基酸组分,通过计算离散增量和离散有限系数预测蛋白质的亚细胞定位,用self—consistency和Jackknife两种方法测试均获得较高的预测成功率。结果表明:蛋白质类中包含的蛋白质数越多,预测成功率越高。  相似文献   

5.
基于离散增量和协变判别函数识别蛋白质亚核定位   总被引:1,自引:0,他引:1  
利用离散增量结合协变判别函数,选取氨基酸组份和N端氨基酸二肽组份为信息参数,对蛋白质亚核定位进行预测.在序列相似性小于等于25%时,406个单定位亚核蛋白Jackknife检验总预测成功率为75.9%,相关系数CC为0.644,把多定位亚核蛋白作为独立测试集,92个多定位亚核蛋白总预测成功率为78.3%.在序列相似性小于等于65%时,504个单定位亚核蛋白Jackknife检验总预测成功率为75.6%,相关系数CC为0.643,92个多定位亚核蛋白总预测成功率为80.4%.与 Lei等人利用Lei-SVM方法对该数据库预测结果相比,单定位亚核蛋白总预测成功率比Lei等人高9.1%,CC值比Lei等人高0.124,多定位亚核蛋白总预测成功率比Lei等人高15.2%.  相似文献   

6.
基于传统的以20种氨基酸在蛋白质序列中的组分来预测蛋白质亚细胞定位的方法,运用了"离散小波变换"(Discrete Wavelet Transform,DWT)的数字信号处理技术,对蛋白质序列中氨基酸排序的特征进行提取,并与氨基酸百分组成相结合,对蛋白质亚细胞定位进行了预测.通过观察预测结果发现,引入氨基酸的排列顺序特征后,蛋白质亚细胞定位的预测正确率有了显著的提高.  相似文献   

7.
为了深入研究正常基因变为癌基因时,氨基酸亲疏水性的变化趋势,在已经建立的代数结构的基础上给出了全新的距离及Y-内积的定义,通过计算得出GF(7)上36个本原多项式及其根,并得出了对应的生物意义的表示,利用所建立的理论数学模型分析了在胃癌,食道癌,肺癌以及B细胞淋巴癌中的p53错义突变过程中氨基酸亲疏水性的变化.结果表明...  相似文献   

8.
本文提出了一种基于SVM快速识别革兰氏阴性菌分泌系统蛋白的方法.该方法以氨基酸组成和位置特异性得分矩阵为最优特征集,充分考虑了蛋白质的序列信息及进化信息.实验结果表明,本文提出的方法对革兰氏阴性菌分泌系统蛋白具有较好的预测性能,可作为细菌分泌系统研究的有益补充.  相似文献   

9.
在Du和Li构建的首个亚线粒体定位数据库基础上,将线粒体蛋白依据亚线粒体位置细分为四大类进行预测.对基于氨基酸的亲疏水特征、物理化学特征和结构特征的蛋白质序列约化信息做出讨论.给出在单肽组分和六类亲疏水约化情形下的蛋白质序列最佳分割位点,结果不仅符合真实生物学现象而且范围更加精确,可为相关实验研究提供参考.提出了最佳组合参数,该参数是ω=0.10,λ=22时亲疏水残基指数值及平行相关形式的伪氨基酸组分结合全序列单肽组分,利用支持向量机算法进行预测,达到了较好的预测结果.利用本文提出的最佳组合参数对未知蛋白序列进行检验,结果显示有一定注释作用,特别是对于Inner membrane类和Matrix类的预测精度较高.  相似文献   

10.
以暗紫贝母的法呢基焦磷酸合酶氨基酸序列为研究对象,利用CD search、ProtParam和SignalP等13种在线预测软件对其保守区域、理化性质、亚细胞定位、亲疏水性、二级结构、三级结构等性质进行分析.结果发现,该酶由352个氨基酸残基组成,是一种不含信号肽不跨膜、定位于线粒体基质的可溶性亲水蛋白,具有典型的类异戊二烯合成酶超家族结构域.其二级结构主要由α-螺旋和无规则卷曲组成.三级结构以PDB ID 4kk2.1为模板建模,包含两个聚异戊烯合酶位点,200 Lys为其结合配体Mg~(2+)的结合位点,活性区域由55个氨基酸残基构成,面积和体积分别为1 215.670?~2和1 496.051?~3.生物信息学手段分析预测结果揭示了暗紫贝母中法呢基焦磷酸合酶的性质、结构和功能,为进一步研究贝母活性生物碱的生物合成调控机制奠定理论基础.  相似文献   

11.
Based on the concept of the pseudo amino acid composition(PseAAC),protein structural classes are predicted by using an approach of increment of diversity combined with support vector machine(ID-SVM),in which the dipeptide amino acid composition of proteins is used as the source of diversity.Jackknife test shows that total prediction accuracy is 96.6% and higher than that given by other approaches.Besides,the specificity(Sp) and the Matthew’s correlation coefficient(MCC) are also calculated for each protein structural class,the Sp is more than 88%,the MCC is higher than 92%,and the higher MCC and Sp imply that it is credible to use ID-SVM model predicting protein structural class.The results indicate that:① the choice of the source of diversity is reasonable,② the predictive performance of ID-SVM is excellent,and ③ the amino acid sequences of proteins contain information of protein structural classes.  相似文献   

12.
SUVA值与超滤膜污染的关系   总被引:1,自引:1,他引:1  
以比紫外吸光度(SUVA)值作为水样中有机物亲疏水特性的表征,基于滤饼过滤模型分析SUVA值变化对膜通量的影响,探究其与膜污染的关系.对以胡敏酸和富里酸配制不同SUVA值的水样进行试验,结果发现:随着水样中胡敏酸质量浓度的升高,SUVA值增大,水中疏水性有机物比例提高,亲水性有机物质量浓度减少;水样经过超滤后SUVA值降低8.35%~43.4%;超滤对有机物的截留以强疏水性有机物为主,截留率在65.79%以上.滤饼过滤模型能很好地拟合试验结果,模型中反应滤饼阻力的kp值与SUVA值显著相关,SUVA值较高的水样,其膜污染程度较高.  相似文献   

13.
为了研究鸡汤乳化液中多肽序列组成与乳化性能之间的关系,通过炖煮鸡骨架3h获得鸡白汤,离心得到稳定的乳化液层,经过除脂、微滤处理,得到乳化多肽溶液。分析发现多肽的平均长度为13个氨基酸残基,临界胶束浓度值为4mg/mL。乳化多肽溶液经3kDa超滤离心管过滤后,进行高效液相色谱-质谱法序列分析,获得1646条多肽序列。统计发现乳化多肽平均疏水度为4791.70kJ/mol,亲水性氨基酸和疏水性氨基酸组成比例接近,疏水性氨基酸或亲水性氨基酸占比很高的多肽数量较少,强亲水性氨基酸和强疏水性氨基酸在多肽序列中的占比不高,多肽两端亲水性氨基酸较多。该研究旨在为新型多功能多肽表面活性剂的开发提供理论依据。  相似文献   

14.
对SWISSPROT(2002年)数据库中经过筛选得到的12类亚细胞序列的氨基酸单个出现的概率、紧邻出现的概率进行统计和比较,结果表明,除个别类之间氨基酸单个出现的概率、紧邻出现的概率比较接近外,在大多数类之间氨基酸单个出现的概率、紧邻出现的概率是有明显区别的.  相似文献   

15.
阳离子表面活性剂与高岭石的相互作用机理   总被引:6,自引:1,他引:6  
采用十二胺阳离子表面活性剂为捕收剂,考察了高岭石的可浮性随pH值的变化情况.通过对高岭石不同解理面的化学组成分析及其与十二胺作用的量子化学计算分析,建立了高岭石在不同pH值条件下与十二胺的作用模型,解释了阳离子作用下高岭石的浮选行为.碱性矿浆中,高岭石颗粒的端面和层面均带负电,各解理面间产生静电斥力而使矿粒充分分散;阳离子十二胺在高岭石的(001)面优先吸附,使高岭石的各表面亲水性不同,从而在亲水力的作用下使颗粒发生疏水絮凝,减少了矿物的疏水表面,使矿物难以被浮选.在酸性条件下,矿浆中存在大量游离的离子,高岭石的(001)面吸附H 而使其表面性质与{001}面性质相似,十二胺能够较均匀地吸附在高岭石的各个解理面上.此外,高岭石颗粒的端面带正电,层面带负电,二者之间静电引力作用使矿粒发生絮凝,减少了高岭石矿粒的总表面积,增加了捕收剂的吸附密度.2种因素共同作用,使高岭石在pH值较低的矿浆中表现出较好的可浮性.  相似文献   

16.
随机选取采食七种树叶的野生蚕蛹,分别测定粗蛋白,脂肪和氨基酸,结果发现:蚕蛹的粗蛋白、脂肪,十七种氨基酸随采食的树叶不同其含量也有差异,这一结果提示我们:不同食料对野生蚕蛹的蛋白质,脂肪和氨基酸的含量有明显的影响,通过不同的食料,可以改变野生蚕蛹中主要营养成份的含量。  相似文献   

17.
A Brack  L E Orgel 《Nature》1975,256(5516):383-387
A survey of the commonest amino acids formed in prebiotic conditions suggests that the earliest form of genetic coding may have specified polypeptides with a strong tendency to form stable Beta-sheet structure. Poly(Val-Lys), like other polypeptides in which hydrophobic and hydrophilic residues alternate, tends to form Beta structures. We show that bilayers with a hydrophobic interior and a hydrophilic exterior may be present in aqueous solution.  相似文献   

18.
在构建小鼠蛋白质亚细胞定位和小鼠跨膜蛋白类型数据库的基础上,利用离散增量结合协变判别函数分别对小鼠蛋白质亚细胞定位和小鼠跨膜蛋白类型进行了预测.对小鼠蛋白质亚细胞定位数据库,Self-consistency检验和Jackknife检验预测成功率分别达到99.0%和75.6%;对小鼠跨膜蛋白类型数据库,Self-consistency检验和Jackknife检验预测成功率分别达到85.6%和77.5%.  相似文献   

19.
Using Hilbert-Huang transform, subcellular localization for prokaryotic and eukaryotic proteins was predicted and tested with Reinhart and Hubbard’s dataset. The prediction accuracy of prokaryotic and eukaryotic protein sequences concentrated in the dataset all reached 100% by self-consistency, 91.8% for the former and 88% for the latter by the five fold cross-validation test. A significant improvement in prediction quality by incorporating the spectrum parameters with the conventional amino acid composition was observed. One of the crucial merits of this approach is that many existing tools in mathematics and engineering can be easily applied in the predicting process. It is anticipated that digital signal processing may serve as a useful vehicle for many other protein science areas.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号