首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
蛋白质残基相互作用网络对理解蛋白质的结构特征,生物学功能和结合位点预测等研究有重要的作用.然而,现有的蛋白质残基相互作用分析方法易用性较差,需要下载和安装程序,较少提供友好易用的网络可视化功能,极大限制了蛋白质结构、功能和药物设计的相关研究.建立了蛋白质残基相互作用网络在线服务及可视化计算平台(http://renault.fun),用户不需要下载和编写程序,仅需上传蛋白质结构数据和口袋相关信息即可搭建蛋白质残基相互作用网络,并实现度中心度(degree centrality),接近中心度(closeness centrality)和中介中心度(betweenness centrality)等网络特征的计算.该计算平台可进一步实现蛋白质残基相互作用网络的可视化,分析蛋白质表面结合口袋的网络特性,对理解蛋白质结构和药物设计的相关应用研究有较大的帮助.  相似文献   

2.
蛋白质相互作用位点的预测对于突变设计和蛋白质相互作用网络的重构都是至关重要的.由于实验确定的蛋白质复合物和蛋白质配体复合物的结构依然相当少,预测蛋白质相互作用位点的计算方法就显得十分重要.该文提出了一种以支持向量机为分类器,以邻近残基的序列剖面和可及表面积为输入数据来预测蛋白质相互作用位点的方法.计算结果显示,界面残基和非界面残基被识别的准确率为75.12%,假阳性率为28.04%.与输入数据仅有序列剖面的方法相比,界面残基和非界面残基被识别的准确率提高了4.34%,假阳性率降低了4.63%.  相似文献   

3.
蛋白质类泛素化修饰位点的准确识别对基础研究和药物开发都具有重要意义.该文提出了一种基于蛋白质序列特征的类泛素化修饰位点预测模型.该模型结合氨基酸的物理化学属性统计特征和氨基酸序列二元语法模式特征,训练一种轻量型梯度提升机(Light gradient boosting machine,LightGBM)分类器预测某个蛋...  相似文献   

4.
SO42-和PO43-配体与蛋白质相结合在生命活动中起着重要的作用,因此,准确预测蛋白质-酸根离子配体结合残基具有重要意义。前人对酸根离子配体结合位点的研究多数是在片段水平上进行的,而极少考虑单残基水平,这可能导致信息的缺失。因此,在片段和单残基水平两个方面提取特征,可以避免信息丢失。在片段水平上使用前人对氨基酸、二级结构、相对溶剂可及性和亲疏水提取的组分信息和位点保守信息作为基础特征,在此基础上引入了单残基水平上的氨基酸、氨基酸的酸碱极性、能量及亲疏水的倾向性因子;结合残基左右残基对信息和9个正交因子为新的特征,使用欠采样和随机森林相融合的算法(U-RF)进行五交叉检验和独立检验,得到了好于前人的预测结果。  相似文献   

5.
针对膜蛋白分类预测问题,在氨基酸组分基础上引入氨基酸位置信息,计算多种氨基酸残基指数的相关系数并选择最优组合方式;融合2类特征信息对膜蛋白序列进行特征提取;采用支持向量机算法作为分类器,构建了一种新型膜蛋白分类模型,在自检验、Jackknife检验和独立测试集检验3种典型方式下,预测准确率分别为98.25%、88.10%和95.62%.结果表明,多特征融合能够有效提取膜蛋白序列的特征信息,与现有方法相比,该分类模型具有较高的分类预测成功率.  相似文献   

6.
计算预测蛋白质磷酸化位点的方法常用于位点识别的初筛阶段。为了提升位点初筛的准确率,本文提出一个深度学习模型MAPhos。该模型首先运用氨基酸向量与位置向量的和表示每一个氨基酸残基;随后使用双向GRU循环神经网络捕获各氨基酸残基的特征;接着引入多头注意力机制计算各注意力头的子上下文向量,并将它们连接起来构成肽段的上下文向量;最后通过一个全连接神经网络进行非线性变换和结果预测。真实数据集上的实验结果表明,MAPhos模型预测磷酸化位点在AUC值、灵敏度、正确率、精度和F1分数统计度量上胜过基于特征提取的模型和基于卷积神经网络的模型,同时与基于卷积神经网络的模型相比具有更好的可解释性,这证明了MAPhos模型更加适用于磷酸化位点识别任务的初筛阶段。  相似文献   

7.
构建了用于预测蛋白质序列中RNA-结合残基的分类模型.在模型的特征提取方面,除了与功能相关的结构特征和序列正交编码信息以外,还提出了一个新颖的特征PSSM-PP.该特征不仅包含蛋白质序列的进化保守特征,还包含与蛋白质和RNA结合有关的氨基酸理化特征.在设计模型时,考虑到样本数据量大的问题,选用了快速的随机森林算法.该预测模型总体预测准确率达到87.02%,特异性达到95.62%,敏感性达51.16%,Matthew相关系数为0.533 6.此外,还构建了RNA结合残基的预测平台.  相似文献   

8.
根据氨基酸的物化特性,基于氨基酸组成成分与氨基酸残基指数自相关函数相结合特征提取法,从非同源蛋白质序列中提取7个特征集(COMP、FINA、MAXF、NAKH、BIOV、OOBM、RICJ),采用有先验知识的投票表决特征融合算法融合这7个特征集,对蛋白质结构类进行预测.结果表明,投票表决融合算法的预测总精度及每一类别的预测精度与7个特征集相比较均有不同程度的提高,说明投票表决融合算法在一定程度上能较多地反映蛋白质的空间结构信息.  相似文献   

9.
基于传统的以20种氨基酸在蛋白质序列中的组分来预测蛋白质亚细胞定位的方法,运用了"离散小波变换"(Discrete Wavelet Transform,DWT)的数字信号处理技术,对蛋白质序列中氨基酸排序的特征进行提取,并与氨基酸百分组成相结合,对蛋白质亚细胞定位进行了预测.通过观察预测结果发现,引入氨基酸的排列顺序特征后,蛋白质亚细胞定位的预测正确率有了显著的提高.  相似文献   

10.
蛋白质磷酸化翻译后修饰在病毒的复制和抑制宿主细胞功能方面发挥重要的作用。然而,利用实验的方法识别磷酸化位点既费时费力又耗财。因此基于蛋白质氨基酸序列发展一种机器学习方法对病毒蛋白磷酸化位点进行预测显得非常有必要。研究结合支持向量机提出识别病毒蛋白磷酸化位点的新方法。采用权重氨基酸成分和属性分组编码对病毒蛋白残基的氨基酸物理化学性质和序列信息进行特征提取,通过10倍交叉验证,丝氨酸、苏氨酸和酪氨酸磷酸化位点的预测准确率分别达到82.0%、85.8%和92.4%。运用该预测模型对丝氨酸残基磷酸化的激酶组进行分类评估,CMGC、AGC和CAMK激酶组的马氏相关系数分别达到69.3%、68.8%和68.2%。结果表明:构建的方法可以有效地预测激酶特异性的磷酸化位点。  相似文献   

11.
亚细胞位点是蛋白质很重要的功能特征.找到一种有效的、可信度高的预测蛋白质位点的方法是很必要的.提出了一种基于马尔科夫模型的改进预测方法.首先,对于一条给定的蛋白质序列,通过计算在马尔科夫模型下20个氨基酸残基的状态转移矩阵,建立一个420维的特征向量,然后利用支持向量机进行训练和预测,最后夹克刀检验证实了该方法的预测精度与以前的马尔科夫模型相比得到了一定的提高.  相似文献   

12.
利用氨基酸序列比对,蛋白质间相互作用位点预测和蛋白质与蛋白质对接,研究Ⅱ型抗癌晶体蛋白的氨基酸组成与其抗肝癌活性之间关系.结果表明:Ⅱ型抗癌晶体蛋白分子上位点49,51,52,55~60,194和205~212的氨基酸残基,特别是芳香族氨基酸在配体和受体蛋白质间的相互作用中起着重要作用;在Hex的蛋白质与蛋白质对接中,配体P11和P32与受体甘油醛-3-磷酸脱氢酶(GAPDH)的结合能量最低,表明P11和P32更容易与GAPDH结合.  相似文献   

13.
将一种新的智能计算方法——DNA计算引入到蛋白质结构预测中,试图建立当蛋白质结构与母板结构相似度比较低的情况下的蛋白质结构比较模型的DNA计算方法。将氨基酸序列中的一个残基的可能构型映射为一段DNA序列,将一个蛋白质结构预测问题转化成一个边赋权的图的最大权团问题,结合最大权团问题的DNA计算模型,建立蛋白质预测问题的DNA算法,并通过仿真实验说明了算法的有效性。  相似文献   

14.
蛋白质二级结构预测时,描述窗口内氨基酸残基序列的各种物理化学和分子结构参数的数量非常大,而且不能很好地直接体现氨基酸的连接顺序,这样就造成二级结构预测工作既费时效果又低下,因此,对这些数据预处理是非常必要的.研究发现,这些初始数据对应的变换矩阵的本征值谱与氨基酸残基序列情况无关,只与氨基酸的类别、数量性质有关,而其本征函数数据能够直接反映氨基酸残基的序列情况,利用有显著大小的本征值对应的本征函数作为描述参数,在进行蛋白质二级结构预测时,不但能够显著减少描述参数的个数,而且它体现了氨基酸顺序的变化,这将有效提高蛋白质二级结构预测研究效果.  相似文献   

15.
16.
基于序列预测二级结构的蛋白质折叠速率的成功预测暗示着折叠速率能够单独从序列中预测出来.为了追踪这一问题,提出了从序列预测折叠速率的一种方法,而不需要任何二级结构和拓扑的信息.残基对折叠速率的影响与氨基酸的性质有密切的关系.对双态和多态蛋白质实验测定的折叠速率的相关性达到了82.9%,这意味着蛋白质的氨基酸序列是决定折叠速率和机理的重要因素.  相似文献   

17.
识别蛋白质相互作用位点在蛋白质功能研究中发挥着重要作用.文章从蛋白质序列出发,提取相关特征——序列谱、序列谱+信息熵,分别形成多个滑动窗口,以此构造输入特征向量.采用"留一法"生成训练数据集和测试数据集,使用支持向量机构建6种分类器,预测测试集中的表面残基是否是蛋白质相互作用位点,得到了较好的结果,说明了实验方法的有效性和可行性.  相似文献   

18.
蛋白质二级结构预测中的简化编码技术   总被引:2,自引:0,他引:2  
神经网络用于蛋白质二级结构预测时,通常氨基酸序列采用正交二进制编码。基于不同残基间的物理化学性质,提出了简化的编码技术,并与其他蛋白质二级结构预测的方法进行了比较。实施结果表明:这种方法更充分地利用了蛋白质一级结构的信息,有较好的效果。  相似文献   

19.
针对现有的第Ⅰ类HLA(HLA-Ⅰ)分子与多肽结合亲和力预测算法在特征构造时依赖传统序列评分函数的问题,为突破用经典机器学习算法构造氨基酸序列特征的局限性,提出一种基于蛋白质预训练模型ProtBert的HLA-Ⅰ与多肽的结合预测算法ProHLAⅠ.该算法利用生命体语言与文本语言在组成上的共性,将氨基酸序列类比句子,通过整合ProtBert预训练模型、 BiLSTM编码和注意力机制的网络结构优势,对HLA-Ⅰ序列和多肽序列进行特征提取,从而实现HLA-Ⅰ独立于位点的多肽结合预测.实验结果表明,该模型在两组独立测试集中均取得了最优性能.  相似文献   

20.
目的 分析甘蓝型油菜的过氧化物酶(Peroxiredoxin, PRDX)家族成员的生物学信息,以期为油菜及相近植物中PRDX的酶学特征及植物抗氧化的分子机制研究提供依据.方法 利用生物信息学方法,分析NCBI(National Center for biotechnology information)数据库中注册的7种油菜PRDX蛋白质的理化性质、信号肽、磷酸化位点、糖基化位点、蛋白质二级结构、三级结构及系统进化特点.结果 甘蓝型油菜PRDX蛋白质比较稳定;氨基酸序列中无信号肽,且不是分泌蛋白;该家族蛋白质中存在较多潜在糖基化位点和磷酸化位点;蛋白质二级结构、三级结构预测结果显示其结构具有极大相似性,且主要以α-螺旋和无规则卷曲为主;系统进化树将该家族成员分为了两个亚家族.结论 本研究为进一步探索植物PRDX家族的生物学功能提供了参考依据.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号