首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
文章通过对氨基酸词频的分析,应用概率神经网络来自动地进行蛋白质亚细胞定位.对于真核生物蛋白质的预测精度达到了82%。对于原核生物的预测精度则达到了92%.而且对于蛋白质序列N端缺失的情况有很好的鲁棒性.  相似文献   

2.
蛋白质亚细胞定位预测研究进展   总被引:1,自引:0,他引:1  
蛋白质的功能与其在细胞中的定位有着密切的联系,新合成的蛋白质必须处于适当的亚细胞位置才能正确的行使其功能.预测蛋白质的亚细胞定位,在确定一个未知蛋白质的功能,了解蛋白质相互作用等方面有着重要的意义.机器学习方法在蛋白质亚细胞定位研究中扮演着一个重要的角色.笔者从数据集的构建、蛋白质序列特征提取方法、蛋白质亚细胞定位预测算法以及预测算法的性能评估等四方面总结了过去十几年间机器学习方法在蛋白质亚细胞定位研究中的应用情况,系统阐述了蛋白质亚细胞定位预测研究的进展.  相似文献   

3.
在构建小鼠蛋白质亚细胞定位和小鼠跨膜蛋白类型数据库的基础上,利用离散增量结合协变判别函数分别对小鼠蛋白质亚细胞定位和小鼠跨膜蛋白类型进行了预测.对小鼠蛋白质亚细胞定位数据库,Self-consistency检验和Jackknife检验预测成功率分别达到99.0%和75.6%;对小鼠跨膜蛋白类型数据库,Self-consistency检验和Jackknife检验预测成功率分别达到85.6%和77.5%.  相似文献   

4.
根据革兰氏阴性菌蛋白不同亚细胞位置、其一级结构中氨基酸含量、氨基酸的关联性及亲疏水性的不同,利用最小离散增量的方法,分别以20个氨基酸组份、400个氨基酸二联体组份及氨基酸亲疏水性在蛋白质上的分布为参数构成离散源,对革兰氏阴性菌蛋白的5类亚细胞定位进行预测,分别用self—consistency方法和Jack-knife方法预测,均取得了较高的预测成功率.  相似文献   

5.
用离散量方法预测蛋白质亚细胞定位   总被引:2,自引:2,他引:2  
根据蛋白质的亚细胞定位,将蛋白质分为四类,用离散量的数学理论,提出了预测蛋白质的亚细胞定位理论方法,利用蛋白质中氨基酸组分,通过计算离散增量和离散有限系数预测蛋白质的亚细胞定位,用self—consistency和Jackknife两种方法测试均获得较高的预测成功率。结果表明:蛋白质类中包含的蛋白质数越多,预测成功率越高。  相似文献   

6.
蛋白质亚细胞定位是当前生物信息学和蛋白质科学的重要研究领域,本研究从蛋白质一级序列出发,取伪氨基酸组成向量作为输入数据,运用支持向量机作为预测工具,对人类12类蛋白质亚细胞的定位进行预测,得到独立检验的结果为85.2%,Jack knife 检验的结果为80.6%;结果显示,用较简单的预测方法,得到了较好的预测结果.  相似文献   

7.
PCA方法在蛋白质亚细胞定位中应用   总被引:1,自引:0,他引:1  
蛋白质的亚细胞定位与其生物功能密切相关,蛋白质数据库急剧膨胀,迫切需要设计出功能强大的高吞吐量的算法来预测蛋白质的亚细胞位置.许多预测工具都是基于伪氨基酸组成构建而成,应用一种数据分析方法——主成分分析(PCA)法,确定能反映序列次序效应的最优λ值.首先让λ取最大以包含尽可能多的序列次序信息,然后利用主成分分析法提取关键主特征.实验结果表明此方法能解决确定最优λ值困难的问题,且性能优于已有的预测工具.  相似文献   

8.
一种新的蛋白质亚细胞定位预测训练集构造方法   总被引:1,自引:0,他引:1  
设计了一种新的蛋白质亚细胞定位预测训练集构造方法.该方法针对传统预测方法缺乏足够的实验标记数据的问题,基于主动学习策略从非实验标记蛋白质数据中主动选择有效数据,并与原有的实验标记数据共同训练预测模型,以提高基准分类器的预测精度.结合支持向量机分类器,该方法在病毒蛋白质独立测试集上进行了预测实验,测试结果表明,该方法能够有效地提高基准分类器的预测能力,性能优于现有的病毒蛋白质预测系统.  相似文献   

9.
针对蛋白质相互作用(protein-protein interaction,PPI)网络中存在大量噪声,以及现有关键蛋白识别方法的挖掘效率和预测准确率不高等问题,提出一种基于复合物信息和亚细胞定位信息(united protein complexes and subcellular locallizations,PCSL)来识别关键蛋白质。首先,整合PPI网络的拓扑属性、生物属性和空间属性构建加权网络,以降低PPI网络中噪声的影响,达到提升PPI网络的可靠性的目的;其次,根据复合物信息和空间信息,设计一种衡量蛋白质关键性的度量,从多维角度强化关键蛋白质在PPI中的重要程度;最后,利用基于PPI网络拓扑特性的寻优算法,设计一种新的试探策略,提升挖掘关键蛋白质的效率。PCSL方法应用在DIP(database of interacting protein)数据集上进行验证。实验结果表明,与其他10种关键蛋白质识别方法相比较,该方法具有较好的识别性能,能够识别更多的关键蛋白质。  相似文献   

10.
蛋白质的结构和功能特性由其氨基酸序列编码,控制序列结构映射的规则被认为是二级遗传密码,氨基酸字母表的简化可以减少蛋白质序列中的冗余,有助于揭示编码规则.基于氨基酸的单体特征、成对相互作用和相似性,可以简化氨基酸字母表.目前,仅基于蛋白质的序列信息,根据最近邻氨基酸的出现频率构建了一个氨基酸的嵌入表示.在此基础上,提出一...  相似文献   

11.
由于蛋白质的功能与亚细胞位置有关,可以通过预测蛋白质的亚细胞位置来推断蛋白质分子的功能.首先介绍了SOM模型和Batch-Type SOM模型,并用这两个模型分别预测了蛋白质的亚细胞位置,结果表明,使用SOM模型和Batch-Type SOM模型均可以比较准确地预测蛋白质的亚细胞位置;Batch-Type SOM模型在保持预测准确率的同时还可以减少预测的时间.  相似文献   

12.
基于传统的以20种氨基酸在蛋白质序列中的组分来预测蛋白质亚细胞定位的方法,运用了"离散小波变换"(Discrete Wavelet Transform,DWT)的数字信号处理技术,对蛋白质序列中氨基酸排序的特征进行提取,并与氨基酸百分组成相结合,对蛋白质亚细胞定位进行了预测.通过观察预测结果发现,引入氨基酸的排列顺序特征后,蛋白质亚细胞定位的预测正确率有了显著的提高.  相似文献   

13.
本文在工作[1][2]的基础上进一步研究了蛋白质二级结构的经验预测,着重讨论了如何制定预测规则的问题,并将预测工作计算机化.在蛋白质资料库中随机选取了21个蛋白质(3296残基)进行预测,正确率对α螺旋和β折迭分别为84.4%和81.9%.  相似文献   

14.
用DABITC/PITC双偶合微量手工液相顺序方法测定了胰岛素样人参肽的氨基酸序列为Glu-Thr-Val-Glu-Ile-Ile-Asp-Ser-Glu-Gly-Gly-Gly-Asp-Ala,与氨基酸组成分析相符。  相似文献   

15.
为了研究高亲和力钠离子依赖二羧酸转运蛋白(high affinity sodium-dependent dicarboxylate transporter,SDCT2,NaDC3)的功能,从小鼠肾组织中克隆出了其cDNA基因,并对其结构特征、基因表达谱及细胞内定位情况进行了分析。结果显示NaDC3蛋白由600个氨基酸组成,同源性分析表明其氨基酸序列与大鼠及人NaDC3分别有97%和87%相同。二级结构分析显示,该蛋白有13个跨膜α-螺旋区。Northern杂交显示该基因可在肾、肝、脑、胎盘等多种组织中表达。激光共聚焦显微镜观察显示该蛋白定位于肾小管上皮细胞膜上。  相似文献   

16.
Introduction In March 2003, a novel coronavirus (CoV) was dis-covered in association with the outbreak of severe acute respiratory syndrome (SARS)[1-3]. The complete genome sequence of several SARS-CoV isolates was soon determined and characterized[4,5]. Comparison of variant SARS-CoV genome sequences has identified certain genetic signatures that can be used to trace sources of infection[6]. Vaccines are now being devel-oped and molecular modeling has suggested that modi-fied rhinovir…  相似文献   

17.
按照马铃薯卷叶病毒(PLRV)核苷酸序列,针对CP基因及其上游基因间隔区全长约0.8kb的区段设计合成两个特异性引物,以马铃薯卷叶病毒中国分离株(PLRV-Ch)的RNA为模板,反转录合成CDNA第一条链,再经PCR扩增合成cDNA,将CDNA克隆于pUC19质粒.限制性酶切分析和核苷酸序列测定表明克隆的PLRV-Ch外壳蛋白(CP)基因及其上游基因间隔区的全长CDNA共824个核苷酸,与国外报道的4个PLRV分离株的核苷梳序列相比具有高度同源性.PLRV的外壳蛋白基因序列与其上游基因间隔区相比保守性更强.  相似文献   

18.
用离散量预测原核生物蛋白质的亚细胞位置   总被引:5,自引:2,他引:5  
基于不同亚细胞位置中蛋白质的氨基酸组成及序列信息不同这一观点,以单个氨基酸含量及两两组合氨基酸含量为信息构成离散源,分别计算了原核生物蛋白质三类亚细胞位置的标准离散量D(Z),D(Xp),D(Xc).利用离散增量的概念预测蛋白质的亚细胞位置,它是由这个蛋白质的离散量D(X)与三个标准离散量D(Xc),D(Xp),D(Xc)之间离散增量的最小值所决定的.采用Self—consistency检验和Jack—knife检验方法,给出了选择五组不同信息作为离散源中参数时的预测结果.与现有的方法比较,发现用Jack—knife检验法预测extracellular类蛋白质时,给出的离散量方法能够给出最好的预测性能,结果也表明提取更多有效的序列信息是提高预测精度的关键.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号