首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
细胞被认为是组成生物体机能的最小单位,而蛋白质是组成细胞的生物大分子,在生物体的生命活动中起着至关重要的作用.给定一个蛋白质序列,预测它在哪一个具体的细胞器工作,如细胞膜、线粒体等,该方法称为蛋白质亚细胞定位.预测蛋白质亚细胞定位是了解其功能和确定药物靶点的必要步骤.现有的预测方法只能预测单个蛋白质的亚细胞位置,本文致力于预测多位点的蛋白质亚细胞位置预测,基于含有3 077个凋亡蛋白的数据集,提取其GO特征并使用LIFT_PCC算法进行预测,实验结果表明该方法整体精度达到了59.36%,并通过了性能测试,这表明该方法将成为一个非常有用的高通量工具.  相似文献   

2.
蛋白质亚细胞定位预测研究进展   总被引:1,自引:0,他引:1  
蛋白质的功能与其在细胞中的定位有着密切的联系,新合成的蛋白质必须处于适当的亚细胞位置才能正确的行使其功能.预测蛋白质的亚细胞定位,在确定一个未知蛋白质的功能,了解蛋白质相互作用等方面有着重要的意义.机器学习方法在蛋白质亚细胞定位研究中扮演着一个重要的角色.笔者从数据集的构建、蛋白质序列特征提取方法、蛋白质亚细胞定位预测算法以及预测算法的性能评估等四方面总结了过去十几年间机器学习方法在蛋白质亚细胞定位研究中的应用情况,系统阐述了蛋白质亚细胞定位预测研究的进展.  相似文献   

3.
蛋白质亚细胞定位是当前生物信息学和蛋白质科学的重要研究领域,本研究从蛋白质一级序列出发,取伪氨基酸组成向量作为输入数据,运用支持向量机作为预测工具,对人类12类蛋白质亚细胞的定位进行预测,得到独立检验的结果为85.2%,Jack knife 检验的结果为80.6%;结果显示,用较简单的预测方法,得到了较好的预测结果.  相似文献   

4.
基于传统的以20种氨基酸在蛋白质序列中的组分来预测蛋白质亚细胞定位的方法,运用了"离散小波变换"(Discrete Wavelet Transform,DWT)的数字信号处理技术,对蛋白质序列中氨基酸排序的特征进行提取,并与氨基酸百分组成相结合,对蛋白质亚细胞定位进行了预测.通过观察预测结果发现,引入氨基酸的排列顺序特征后,蛋白质亚细胞定位的预测正确率有了显著的提高.  相似文献   

5.
 基于蛋白质的合成及分选机制,提出了一种新的蛋白质亚细胞定位预测方法。先采用遍历搜索技术,找出各种亚细胞蛋白质序列分选信号和成熟蛋白质之间的最佳分割位点,把蛋白质序列分为两条子序列,计算这两条子序列中的氨基酸组份并将它们融合起来作为整条蛋白质序列的特征,然后构造用于识别每类蛋白质的最佳子分类器,再根据最大化原则组建集成分类器。在NNPSL数据集上,采用5重交叉验证方法对本文方法进行测试,原核和真核两个蛋白质序列子集分别取得94.1%和87.5%的总体预测精度。同时,此方法在一些蛋白质序列中找到的分割位点与真实生物现象相吻合,能为预测蛋白质序列的剪切位点提供参考信息。  相似文献   

6.
基于支持向量机,以全部和局部氨基酸序列的n肽组分、序列的亲疏水性分布等五种特征提取方法构成特征向量表示蛋白质序列,对六类细胞凋亡蛋白的亚细胞位置进行预测.结果表明,基于氨基酸二肽组成成分构成的特征向量集(以符号DIPE表示)的预测结果高于其它四种特征向量集的预测结果,在Jackknife检验下,总预测成功率达到了89.3%;与现有的方法比较,发现对于Mitochondrial类凋亡蛋白,支持向量机方法有更好的预测效果.  相似文献   

7.
针对从蛋白质原始序列中预测蛋白质定位及功能信息这个生物信息学中研究的热点问题,提出进化模糊K近邻算法(Evolutionary Fuzzy K-Nearest Neighbor,EFKNN)直接处理多分类问题的预测模型,用EFKNN及其集成直接从蛋白质序列中预测蛋白质亚核定位。采用5种特征提取算法从蛋白质序列中提取特征,训练了5个基于EFKNN的基分类器,并根据得票量大小原则集成每个基分类器的分类结果作为待测样本的输出。将蛋白质亚核定位预测中常用的数据集SNL9作为训练集,利用jackknife测试方法预测了数据集中每条单定位亚核蛋白,正确率为70.0%,表明该模型可以作为蛋白质亚核定位预测的工具或对现有预测模型和方法的补充。  相似文献   

8.
提出一种蛋白质亚细胞定位预测方法.该方法以位置特异性得分矩阵和基因本体抽取对应特征,结合支持向量机构建多标签分类模型.充分考虑了蛋白质进化信息对其亚细胞定位的影响,并基于文本分类中涉及到的卡方检验的对数变换思想,构建基因本体注释信息的加权系数对其进行加权处理,从而提高预测的准确率.采用支持向量机作为基分类器构建多标签分类模型,进一步提高预测的准确率.通过在目前该领域两个常用的真实数据集上进行的一系列测试结果表明,该方法能有效提高蛋白质亚细胞定位预测的准确率.  相似文献   

9.
由于蛋白质的功能与亚细胞位置有关,可以通过预测蛋白质的亚细胞位置来推断蛋白质分子的功能.首先介绍了SOM模型和Batch-Type SOM模型,并用这两个模型分别预测了蛋白质的亚细胞位置,结果表明,使用SOM模型和Batch-Type SOM模型均可以比较准确地预测蛋白质的亚细胞位置;Batch-Type SOM模型在保持预测准确率的同时还可以减少预测的时间.  相似文献   

10.
在多因变量多元线性模型中就岭型主成分型预测与最优线性无偏预测、主成分型预测之间的最优性判别问题进行讨论.得到岭型主成分型预测在R(i)(·)准则下优于最优线性无偏预测和主成分型预测的两个充要条件,同时得到了其在MDE-准则和矩阵迹RT(·)意义下优于最优线性无偏预测和主成分型预测的充分条件.  相似文献   

11.
用离散量方法预测细胞凋亡蛋白的亚细胞位置   总被引:2,自引:0,他引:2  
细胞凋亡蛋白的亚细胞位置与它的功能紧密相联.基于一个凋亡蛋白的亚细胞位置主要决定于它的氨基酸序列这一观点,提出了一种新的预测凋亡蛋白亚细胞位置的算法——离散量方法.计算了蛋白质一级序列中紧邻残基对的出现个数,作为离散源中的参数,利用离散增量极小化对四类凋亡蛋白进行定位预测.采用Zhou和Doctor使用的数据库,通过Re-sub-stitution检验和Jack-knife检验方法,离散量方法比他们使用的协变判别式算法总体预测成功率分别高1.0%和12.2%;采用我们自己整理的扩大以后的数据库,通过Re-substitution检验和Jack-knife检验方法,总体预测成功率分别为88.1%和78.1%.  相似文献   

12.
主成分分析的一个黎曼几何随机算法   总被引:1,自引:0,他引:1  
一个典型的求解主成分问题的方法是Oja-Sanger算法,但其不能保证迭代矩阵列的单位列正交性,实际计算时矩阵列甚至是无界的.将主成分问题等价变换为Stiefel流形上的一个二次优化问题,采用黎曼几何算法思想,获得求解主成分分析(PCA)的一个黎曼几何随机算法(自适应算法).该方法可确保迭代矩阵列的单位列正交性.数值模拟结果表明,本文算法优于Oja-Sanger算法.  相似文献   

13.
Subcellular localization is an important feature of proteins which is closely correlated to their function. In this work,we tried to develop a new coding method of using those location predictive molecular function terms of protein as the input for the prediction of subcellular localization. Combined with the amino acid pair composition of the sequence,this coding system is proved to be efficient for support vector machine (SVM) and to have satisfied performance when tested on the RH dataset. Meanwhile,the model also shows robustness against N-terminal uncertainties in sequences.  相似文献   

14.
亚细胞位点是蛋白质很重要的功能特征.找到一种有效的、可信度高的预测蛋白质位点的方法是很必要的.提出了一种基于马尔科夫模型的改进预测方法.首先,对于一条给定的蛋白质序列,通过计算在马尔科夫模型下20个氨基酸残基的状态转移矩阵,建立一个420维的特征向量,然后利用支持向量机进行训练和预测,最后夹克刀检验证实了该方法的预测精度与以前的马尔科夫模型相比得到了一定的提高.  相似文献   

15.
把有穷正级λ的亚纯函数f(z)以∞为Borel例外值看成分类条件,对f(z)不以∞为Borel例外值时,利用复分析方法得到了有穷正级数亚纯函数的Borel方向的判定定理,彻底解决了有穷正级数λ的亚纯函数与其导数必定存在公共的λ级Borel方向问题。  相似文献   

16.
在构建小鼠蛋白质亚细胞定位和小鼠跨膜蛋白类型数据库的基础上,利用离散增量结合协变判别函数分别对小鼠蛋白质亚细胞定位和小鼠跨膜蛋白类型进行了预测.对小鼠蛋白质亚细胞定位数据库,Self-consistency检验和Jackknife检验预测成功率分别达到99.0%和75.6%;对小鼠跨膜蛋白类型数据库,Self-consistency检验和Jackknife检验预测成功率分别达到85.6%和77.5%.  相似文献   

17.
基于PCA与神经网络的雷达故障组合诊断方法   总被引:1,自引:0,他引:1  
针对目前单一诊断方法的缺陷,提出了一种基于主元分析方法(PCA)和神经网络的组合故障诊断方法.利用多PCA来监测雷达状态,在雷达状态异常时再通过分析变量贡献率来确定故障部位,最终采用神经网络进行故障诊断.仿真实验了该方法的有效性.  相似文献   

18.
药用植物灯盏花在使用中会与飞蓬属或紫菀属植物混淆,对灯盏花mat K基因生物信息学分析及灯盏花植物形态的研究,实现灯盏花与混淆植物的鉴定.采用PCR方法扩增并克隆了灯盏花mat K基因,对该基因进行生物信息学分析,结果显示,灯盏花mat K基因总长为1 317 bp,编码438个氨基酸,无信号肽,无跨膜结构,表现为亲水性,二级结构以α螺旋、β折叠为主,亚细胞定位预测mat K基因位于真核生物的叶绿体中,有8个蛋白结合区和3个多核苷酸结合区,用植物形态、氨基酸序列变异和系统进化树相结合,可以达到鉴别灯盏花与混淆物种作用.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号