首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 218 毫秒
1.
根据革兰氏阴性菌蛋白不同亚细胞位置、其一级结构中氨基酸含量、氨基酸的关联性及亲疏水性的不同,利用最小离散增量的方法,分别以20个氨基酸组份、400个氨基酸二联体组份及氨基酸亲疏水性在蛋白质上的分布为参数构成离散源,对革兰氏阴性菌蛋白的5类亚细胞定位进行预测,分别用self—consistency方法和Jack-knife方法预测,均取得了较高的预测成功率.  相似文献   

2.
用离散量预测原核生物蛋白质的亚细胞位置   总被引:5,自引:2,他引:5  
基于不同亚细胞位置中蛋白质的氨基酸组成及序列信息不同这一观点,以单个氨基酸含量及两两组合氨基酸含量为信息构成离散源,分别计算了原核生物蛋白质三类亚细胞位置的标准离散量D(Z),D(Xp),D(Xc).利用离散增量的概念预测蛋白质的亚细胞位置,它是由这个蛋白质的离散量D(X)与三个标准离散量D(Xc),D(Xp),D(Xc)之间离散增量的最小值所决定的.采用Self—consistency检验和Jack—knife检验方法,给出了选择五组不同信息作为离散源中参数时的预测结果.与现有的方法比较,发现用Jack—knife检验法预测extracellular类蛋白质时,给出的离散量方法能够给出最好的预测性能,结果也表明提取更多有效的序列信息是提高预测精度的关键.  相似文献   

3.
基于支持向量机,以全部和局部氨基酸序列的n肽组分、序列的亲疏水性分布等五种特征提取方法构成特征向量表示蛋白质序列,对六类细胞凋亡蛋白的亚细胞位置进行预测.结果表明,基于氨基酸二肽组成成分构成的特征向量集(以符号DIPE表示)的预测结果高于其它四种特征向量集的预测结果,在Jackknife检验下,总预测成功率达到了89.3%;与现有的方法比较,发现对于Mitochondrial类凋亡蛋白,支持向量机方法有更好的预测效果.  相似文献   

4.
在构建小鼠蛋白质亚细胞定位和小鼠跨膜蛋白类型数据库的基础上,利用离散增量结合协变判别函数分别对小鼠蛋白质亚细胞定位和小鼠跨膜蛋白类型进行了预测.对小鼠蛋白质亚细胞定位数据库,Self-consistency检验和Jackknife检验预测成功率分别达到99.0%和75.6%;对小鼠跨膜蛋白类型数据库,Self-consistency检验和Jackknife检验预测成功率分别达到85.6%和77.5%.  相似文献   

5.
从酶的一级序列出发,以20种氨基酸和其紧邻与次邻的氨基酸二联体在序列中出现的个数为参数,用离散量算法对酶的亚类进行预测.通过用Self-consistency和Jack-knife两种检验方法检验时,均获得较好的预测精度.结果表明该方法新颖、简单、有效.  相似文献   

6.
用离散量方法预测蛋白质亚细胞定位   总被引:2,自引:2,他引:2  
根据蛋白质的亚细胞定位,将蛋白质分为四类,用离散量的数学理论,提出了预测蛋白质的亚细胞定位理论方法,利用蛋白质中氨基酸组分,通过计算离散增量和离散有限系数预测蛋白质的亚细胞定位,用self—consistency和Jackknife两种方法测试均获得较高的预测成功率。结果表明:蛋白质类中包含的蛋白质数越多,预测成功率越高。  相似文献   

7.
细胞被认为是组成生物体机能的最小单位,而蛋白质是组成细胞的生物大分子,在生物体的生命活动中起着至关重要的作用.给定一个蛋白质序列,预测它在哪一个具体的细胞器工作,如细胞膜、线粒体等,该方法称为蛋白质亚细胞定位.预测蛋白质亚细胞定位是了解其功能和确定药物靶点的必要步骤.现有的预测方法只能预测单个蛋白质的亚细胞位置,本文致力于预测多位点的蛋白质亚细胞位置预测,基于含有3 077个凋亡蛋白的数据集,提取其GO特征并使用LIFT_PCC算法进行预测,实验结果表明该方法整体精度达到了59.36%,并通过了性能测试,这表明该方法将成为一个非常有用的高通量工具.  相似文献   

8.
蛋白质亚细胞定位预测研究进展   总被引:1,自引:0,他引:1  
蛋白质的功能与其在细胞中的定位有着密切的联系,新合成的蛋白质必须处于适当的亚细胞位置才能正确的行使其功能.预测蛋白质的亚细胞定位,在确定一个未知蛋白质的功能,了解蛋白质相互作用等方面有着重要的意义.机器学习方法在蛋白质亚细胞定位研究中扮演着一个重要的角色.笔者从数据集的构建、蛋白质序列特征提取方法、蛋白质亚细胞定位预测算法以及预测算法的性能评估等四方面总结了过去十几年间机器学习方法在蛋白质亚细胞定位研究中的应用情况,系统阐述了蛋白质亚细胞定位预测研究的进展.  相似文献   

9.
长链非编码RNA(lncRNA)的亚细胞位置信息对于了解其复杂的生物学功能和生物学过程具有重要的意义。建立了一个lncRNA的亚细胞定位数据集,包括细胞核、细胞质基质、核糖体和外泌体四个位置,提取了lncRNA的多种特征信息,并对各类特征进行了特征融合。在利用SMOTE(Synthetic Minority Oversampling Technique)方法对数据集进行平衡优化的基础上,采用支持向量机(SVM)算法对lncRNA的亚细胞定位进行分类预测。Jackknife检验结果显示总体预测成功率可达98.54%,表明所提取的特征信息对于lncRNA的亚细胞定位预测有很好的效果,可以为了解lncRNA的生物学功能提供帮助。  相似文献   

10.
PCA方法在蛋白质亚细胞定位中应用   总被引:1,自引:0,他引:1  
蛋白质的亚细胞定位与其生物功能密切相关,蛋白质数据库急剧膨胀,迫切需要设计出功能强大的高吞吐量的算法来预测蛋白质的亚细胞位置.许多预测工具都是基于伪氨基酸组成构建而成,应用一种数据分析方法——主成分分析(PCA)法,确定能反映序列次序效应的最优λ值.首先让λ取最大以包含尽可能多的序列次序信息,然后利用主成分分析法提取关键主特征.实验结果表明此方法能解决确定最优λ值困难的问题,且性能优于已有的预测工具.  相似文献   

11.
对SWISSPROT(2002年)数据库中经过筛选得到的12类亚细胞序列的氨基酸单个出现的概率、紧邻出现的概率进行统计和比较,结果表明,除个别类之间氨基酸单个出现的概率、紧邻出现的概率比较接近外,在大多数类之间氨基酸单个出现的概率、紧邻出现的概率是有明显区别的.  相似文献   

12.
Subcellular localization is an important feature of proteins which is closely correlated to their function. In this work,we tried to develop a new coding method of using those location predictive molecular function terms of protein as the input for the prediction of subcellular localization. Combined with the amino acid pair composition of the sequence,this coding system is proved to be efficient for support vector machine (SVM) and to have satisfied performance when tested on the RH dataset. Meanwhile,the model also shows robustness against N-terminal uncertainties in sequences.  相似文献   

13.
亚细胞位点是蛋白质很重要的功能特征.找到一种有效的、可信度高的预测蛋白质位点的方法是很必要的.提出了一种基于马尔科夫模型的改进预测方法.首先,对于一条给定的蛋白质序列,通过计算在马尔科夫模型下20个氨基酸残基的状态转移矩阵,建立一个420维的特征向量,然后利用支持向量机进行训练和预测,最后夹克刀检验证实了该方法的预测精度与以前的马尔科夫模型相比得到了一定的提高.  相似文献   

14.
Microarrays of cells expressing defined cDNAs   总被引:34,自引:0,他引:34  
Ziauddin J  Sabatini DM 《Nature》2001,411(6833):107-110
Genome and expressed sequence tag projects are rapidly cataloguing and cloning the genes of higher organisms, including humans. An emerging challenge is to rapidly uncover the functions of genes and to identify gene products with desired properties. We have developed a microarray-driven gene expression system for the functional analysis of many gene products in parallel. Mammalian cells are cultured on a glass slide printed in defined locations with different DNAs. Cells growing on the printed areas take up the DNA, creating spots of localized transfection within a lawn of non-transfected cells. By printing sets of complementary DNAs cloned in expression vectors, we make microarrays whose features are clusters of live cells that express a defined cDNA at each location. Here we demonstrate two uses for our approach: as an alternative to protein microarrays for the identification of drug targets, and as an expression cloning system for the discovery of gene products that alter cellular physiology. By screening transfected cell microarrays expressing 192 different cDNAs, we identified proteins involved in tyrosine kinase signalling, apoptosis and cell adhesion, and with distinct subcellular distributions.  相似文献   

15.
16.
A novel coronavirus has been identified as the causative agent of the severe acute respiratory syndrome (SARS). For all the SARS-CoV associated proteins derivated from the SARS-CoV genome, the physiochemical properties such as the molecular weight, isoelectric point and extinction coefficient of each protein were calculated. The transmembrane segments and subeellular localization (SubLoeation) prediction and conserved protein motifs search against database were employed to analyze the function of SARS-CoV proteins. Also, the homology protein sequence alignment and evolutionary distance matrix calculation between SARS-CoV associated proteins and the corresponding proteins of other coronaviruses were employed to identify the classification and phylogenetic relationship between SARS-CoV and other coronaviruses. The results showed that SARS-CoV is a novel coronavirus which is different from any of the three previously known groups of coronviruses, but it is closer to BoCoV and MHV than to other coronaviruses. This study is in aid of experimental determination of SARS-CoV proteomics and the development of antiviral vaccine.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号