首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
运用RBF神经网络预测蛋白质相互作用位点.首先提取序列谱、保守权重、熵值、复合物可及表面积和序列变化率等一系列蛋白质相互作用位点的关键特征.然后应用RBF神经网络以及它们的集成来对这些样本集进行训练与测试.使用10次交叉验证进行训练与测试,创建了4组具有对比性的蛋白质相互作用特征组合.实验中每加入一种新的特征时正确预测率都会相应的提高,特别是加入可及表面积和序列变化率特征时正确率提高幅度更大,表明利用多特征组合,结合RBF神经网络算法进行预测蛋白质相互作用位点的方法是正确有效的.  相似文献   

2.
本文从swiss-prot中选取经过试验验证的水稻蛋白质磷酸化位点数据作为训练集合,应用蛋白质序列特征提取方法Composition of k-spaced residues pairs (CKSAAP),为利用SVM算法构建专门针对水稻蛋白质磷酸化位点的预测工具做准备。 CKSAAP方法利用在序列片断中残基的K个间隔距离的组成,进一步反映了残基之间的相关性。本文利用LibSVM软件包对已通过改进过得CKSAAP方法特征提取出来的数值特征对磷酸化位点进行预测,从而为之后构建水稻蛋白质磷酸化位点的预测工具做准备。结果表明,本文基于SVM和CKSAAP方法的水稻蛋白质磷酸化位点预测在丝氨酸,苏氨酸和酪氨酸的平均预测准确性为80.638%,马修斯系数为0.611。与PlantPhos和Musite的预测性能的对比结果显示,在磷酸化各氨基酸位点的预测性能高于PlantPhos及Musite。  相似文献   

3.
蛋白质类泛素化修饰位点的准确识别对基础研究和药物开发都具有重要意义.该文提出了一种基于蛋白质序列特征的类泛素化修饰位点预测模型.该模型结合氨基酸的物理化学属性统计特征和氨基酸序列二元语法模式特征,训练一种轻量型梯度提升机(Light gradient boosting machine,LightGBM)分类器预测某个蛋...  相似文献   

4.
亚细胞位点是蛋白质很重要的功能特征.找到一种有效的、可信度高的预测蛋白质位点的方法是很必要的.提出了一种基于马尔科夫模型的改进预测方法.首先,对于一条给定的蛋白质序列,通过计算在马尔科夫模型下20个氨基酸残基的状态转移矩阵,建立一个420维的特征向量,然后利用支持向量机进行训练和预测,最后夹克刀检验证实了该方法的预测精度与以前的马尔科夫模型相比得到了一定的提高.  相似文献   

5.
为了提高蛋白质O-糖基化位点的预测准确率,提出了把核主成分分析(KPCA)与支持向量机(SVM)相结合的方法。实验样本用稀疏编码方式编码,窗口长度为21。首先,用核主成分分析提取了样本的核主成分(特征);然后,在特征空间中用改进的支持向量机(ISVM)进行分类(预测)。在使用支持向量机分类时,设置了一个边界系数来减少运算的复杂度。实验结果表明,使用KPCA ISVM的方法预测的效果优于PCA SVM的预测效果。预测准确率为87%。更进一步,用不同长度的样本做实验(w=5,7,9,11,21,31,41,51),使用多数投票法综合各子分类器的优势。结果表明,组合分类器的预测准确率优于子分类器的预测准确率,预测准确率为88%。  相似文献   

6.
蛋白质的残基相对可溶性表征蛋白质残基在三级结构中与溶剂接触的程度,它反映蛋白质三级结构及功能位点的主要特征。文章通过引入免疫算法中的亲和度和浓度概念,提出了一种改进贝叶斯优化算法,形成了贝叶斯优化算法选择局部残基相对可溶性优化依据。利用改进贝叶斯优化算法对2148条蛋白链进行分类实验,分析了窗宽对结果的影响,计算了三组数据在最佳参数状态下平均预测精度为79.7%。与其它方法相比,从结果来看,改进贝叶斯优化算法具有更好分类预测性能。  相似文献   

7.
蛋白质-DNA相互作用位点在各类生理生化反应中扮演重要角色.本论文旨在构建一种可以准确预测“相互作用位点”的方法:PdDNA,其内容主要包括支持向量机和序列匹配器.支持向量机通过提取相互作用位点中心残基的特征进行训练并分类,序列匹配器则通过蛋白质特征矩阵(PSSM)对氨基酸序列进行相关性评估,对二者结果进行归一化整合,得到最终的预测结果.利用公开数据集PDNA_62,我们的PdDNA预测准确率为86.87%.为进一步验证PdDNA可靠性,我们还自建了PDNA_224数据集,其预测准确率为83.07%,处于较高水平.因此PdDNA是一种有效的“蛋白质-DNA相互作用位点”预测方法.  相似文献   

8.
蛋白质相互作用位点的预测对于突变设计和蛋白质相互作用网络的重构都是至关重要的.由于实验确定的蛋白质复合物和蛋白质配体复合物的结构依然相当少,预测蛋白质相互作用位点的计算方法就显得十分重要.该文提出了一种以支持向量机为分类器,以邻近残基的序列剖面和可及表面积为输入数据来预测蛋白质相互作用位点的方法.计算结果显示,界面残基和非界面残基被识别的准确率为75.12%,假阳性率为28.04%.与输入数据仅有序列剖面的方法相比,界面残基和非界面残基被识别的准确率提高了4.34%,假阳性率降低了4.63%.  相似文献   

9.
赖氨酸乙酰化(Lysine acetylation,Kace)普遍存在于人体代谢酶中,与多种代谢疾病密切相关,因此准确识别该位点对于代谢疾病治疗的研究具有重要意义.现有的Kace位点预测方法大多采用蛋白质序列层面的信息作为输入,蛋白质结构特性考虑不全面;特征提取时未关注氨基酸残基间顺序相关性,信息丢失严重,降低了预测准确度.提出一种新的Kace位点预测深度学习CL-Kace模型. CL-Kace引入蛋白质结构特性,并与蛋白质原始序列、氨基酸理化属性共同构建位点特征空间,采用卷积神经网络(Convolutional Neural Network,CNN)提取特征;引入双向长短期记忆(Bidirectional Long Short-Term Memory,BiLSTM)网络捕获残基间的顺序依赖关系,以提高网络的抽象能力,识别潜在的Kace位点.实验结果表明,CL-Kace模型优于现有的Kace位点预测器,能够有效地预测潜在的位点.  相似文献   

10.
 基于蛋白质的合成及分选机制,提出了一种新的蛋白质亚细胞定位预测方法。先采用遍历搜索技术,找出各种亚细胞蛋白质序列分选信号和成熟蛋白质之间的最佳分割位点,把蛋白质序列分为两条子序列,计算这两条子序列中的氨基酸组份并将它们融合起来作为整条蛋白质序列的特征,然后构造用于识别每类蛋白质的最佳子分类器,再根据最大化原则组建集成分类器。在NNPSL数据集上,采用5重交叉验证方法对本文方法进行测试,原核和真核两个蛋白质序列子集分别取得94.1%和87.5%的总体预测精度。同时,此方法在一些蛋白质序列中找到的分割位点与真实生物现象相吻合,能为预测蛋白质序列的剪切位点提供参考信息。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号