首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 812 毫秒
1.
蛋白质相互作用位点的预测对于突变设计和蛋白质相互作用网络的重构都是至关重要的.由于实验确定的蛋白质复合物和蛋白质配体复合物的结构依然相当少,预测蛋白质相互作用位点的计算方法就显得十分重要.该文提出了一种以支持向量机为分类器,以邻近残基的序列剖面和可及表面积为输入数据来预测蛋白质相互作用位点的方法.计算结果显示,界面残基和非界面残基被识别的准确率为75.12%,假阳性率为28.04%.与输入数据仅有序列剖面的方法相比,界面残基和非界面残基被识别的准确率提高了4.34%,假阳性率降低了4.63%.  相似文献   

2.
以NMR技术为代表的海量蛋白质空间结构数据为现代生命科学研究提供了前所未有的机遇,但后续的大数据分析却成为一大难题。充分利用已知的蛋白质三维结构信息来预测未知的蛋白质空间结构信息是研究蛋白质结构和功能关系一种重要手段。本文提出一种基于黎曼流形的蛋白质三维结构相似性比较新方法。该方法通过构建Cα坐标系和提取蛋白质结构具有旋转和平移不变性的几何特征量,将蛋白质的三维坐标序列转换为一维序列,采用黎曼距离作为三维结构相似度指标。本方法不需要对蛋白质结构做旋转和平移变换,避免了主流的RMSD方法中两蛋白质通过最小二乘拟合进行配准时产生的误差,并且完全不依赖于一级结构序列信息,对不具备序列相似性的蛋白质之间的相似性比较具有现实意义。本文分别针对不同相似度的蛋白质、Fischer提出的10个较难识别的蛋白质结构对、HOMSTRAD数据库中的700个数据这3组数据,对本文算法进行了验证。实验结果表明,与其他方法相比,本文方法的匹配精度均得到了较大提升。  相似文献   

3.
蛋白质超家族模体保守性及物理化学性质的分析   总被引:1,自引:1,他引:0  
分析了全β类4个典型的蛋白质超家族中模体的功能,发现免疫球蛋白超家族和纤维结合蛋白类型Ⅲ超家族中的模体有相似的结构,但是它们行使不同的功能.血小板-白细胞C激酶底物的同源物结构域超家族和核酸结合超家族中的模体类型较多,虽然这些模体只是部分结构相似,然而它们却在各自的超家族中分别执行着相同的功能.文章进一步运用统计学方法研究了蛋白质超家族中保守模体的亲疏水特征、物理化学特征和结构特征.结果表明,模体差异有显著意义的残基存在于序列模体的保守位点上,相同的序列模体具有相似的二级结构.这些特征将对进一步识别超家族提供帮助.  相似文献   

4.
调用motif数据库、profile数据库和interproscan数据库,对THE蛋白进行了序列同源性分析和功能位点分析.结果表明,THE蛋白质是一种核蛋白,理论等电点为6.36,分子量为44 859 Dalton.应用多种相关软件对THE蛋白的二级结构和特殊结构进行了初步预测,结果显示:THE蛋白中存在α螺旋、β-折叠片和无规卷曲结构,有两个可形成跨膜结构的片段,不存在卷曲螺旋,无信号肽,也无线粒体定位信号.对THE蛋白进行序列同源性、结构域及功能位点预测,结果显示:THE蛋白与来自大鼠睾丸的Tes13-S、Fos13-L和几种假设蛋白有较高的相似性;THE蛋白存在次黄嘌呤核苷酸脱氢酶、嘌呤核苷酸还原酶结构域及PKC、酰胺化、豆蔻酸连接等功能位点,无糖基化位点.THE蛋白的结构分析与功能预测为该基因的功能研究提供了重要的依据.  相似文献   

5.
一定氨基酸序列顺序排列的多肽链是如何形成有一定空间结构的蛋白质分子的问题仍是分子生物学中心法则中到目前为止还悬而未决的问题.所以预测蛋白质的三级结构是分子生物学迫切需要解决的问题之一.一般认为蛋白质的结构是由其氨基酸序列所决定的,但我们现在所拥有的知识还不足以对蛋白质的三级结构准确地预测.因而在此之前准确预测蛋白质二级结构对于预测蛋白质三级结构有着重要的意义[1,2].  相似文献   

6.
基于小波分析法的蛋白质结构研究   总被引:3,自引:0,他引:3  
用小波的方法预测了一个已知结构蛋白质的二级结构,并把它同互连网蛋白质结构预测服务及其他结构预测软件得到的二级结构进行比较。结果表明:该方法可以较好地确定蛋白质的二级结构且不必进行同源蛋白质序列的联配。在预测未知结构的蛋白质序列方面,该方法与其他方法相比,预测结果并无显著差异,这说明小波分析法可以用于蛋白质结构研究,若与其他方法结合用于结构预测,将会起到更好的作用。  相似文献   

7.
支持向量机程序SVMProt预测SArs病毒蛋白质的功能   总被引:1,自引:0,他引:1  
对SARS冠状病毒蛋白质功能的有效识剐将有利于促进SARS传染病治疗药物的开发。应用基于支持向量机原理的SVMProt程序识别SARS冠状病毒蛋白质的功能,通过对SARS冠状病毒中2个已知功能的蛋白质功能的成功预测,说明SVMProt能够有效地应用于SARS冠状病毒蛋白质及其他种类蛋白质的功能预测。对SARS冠状病毒中至今仍未知其功能的蛋白质ORFl3的功能进行了预测,结果显示ORFl3是一种可能与DNA结合的核蛋白并兼有病毒体内结构蛋白的功能。  相似文献   

8.
蛋白质结构域是研究蛋白质结构、功能与进化的基本单位,不同的结构域可组合出更为复杂的蛋白质分子.划分蛋白质结构域后,可以从结构域的角度研究蛋白质的结构、功能与进化,降低了研究复杂度.根据已知结构的蛋白质统计,有约40%的为多结构域蛋白质,其中还存在一级结构上不临近的氨基酸序列出现在同一个结构域的情况,即不连续结构域.文章给出了当前国内外有关蛋白质结构域边界预测、不连续结构域检测及结构域数据库与在线服务的研究进展,供相关研究者参考.  相似文献   

9.
蛋白质-DNA相互作用位点在各类生理生化反应中扮演重要角色.本论文旨在构建一种可以准确预测“相互作用位点”的方法:PdDNA,其内容主要包括支持向量机和序列匹配器.支持向量机通过提取相互作用位点中心残基的特征进行训练并分类,序列匹配器则通过蛋白质特征矩阵(PSSM)对氨基酸序列进行相关性评估,对二者结果进行归一化整合,得到最终的预测结果.利用公开数据集PDNA_62,我们的PdDNA预测准确率为86.87%.为进一步验证PdDNA可靠性,我们还自建了PDNA_224数据集,其预测准确率为83.07%,处于较高水平.因此PdDNA是一种有效的“蛋白质-DNA相互作用位点”预测方法.  相似文献   

10.
亚细胞位点是蛋白质很重要的功能特征.找到一种有效的、可信度高的预测蛋白质位点的方法是很必要的.提出了一种基于马尔科夫模型的改进预测方法.首先,对于一条给定的蛋白质序列,通过计算在马尔科夫模型下20个氨基酸残基的状态转移矩阵,建立一个420维的特征向量,然后利用支持向量机进行训练和预测,最后夹克刀检验证实了该方法的预测精度与以前的马尔科夫模型相比得到了一定的提高.  相似文献   

11.
本文根据马铃薯GDP-L-半乳糖磷酸化酶类1基因的EST序列,运用多种生物信息学方法,对其进行初步的生物信息学分析.电子克隆获得了该基因的全长,结果表明:该序列全长1 742 bp,共编码357个氨基酸,有多个限制性酶切位点,有多个磷酸化位点,属于亲水性氨基酸,无信号肽,有膜穿透性.通过蛋白质二级结构功能域的预测,发现该序列中含有11个功能位点.通过蛋白质同源序列比对,发现该基因与番茄GDP-L-半乳糖磷酸化酶基因相似度极高,暗示该基因与番茄GDP-L-半乳糖磷酸化酶基因具有相似的生物学功能.以上结果可以为进一步研究该基因在马铃薯中特别是在抗青枯病分子育种中的功能提供相关依据.  相似文献   

12.
识别蛋白质相互作用位点在蛋白质功能研究中发挥着重要作用.文章从蛋白质序列出发,提取相关特征——序列谱、序列谱+信息熵,分别形成多个滑动窗口,以此构造输入特征向量.采用"留一法"生成训练数据集和测试数据集,使用支持向量机构建6种分类器,预测测试集中的表面残基是否是蛋白质相互作用位点,得到了较好的结果,说明了实验方法的有效性和可行性.  相似文献   

13.
关于蛋白质家族、结构和新功能的统计推断是应用数理统计的一个前沿交叉研究方向.本文以蛋白质结构分类数据库SCOP和序列分类数据库Pfam为基础,结合SCOP数据库的动态信息,我们估计出覆盖当前Pfam数据库所需的折叠子总数;通过SCOP中新增家族在Pfam中的对应家族所属的折叠子是否已知为先验信息构建贝叶斯模型,估计了不同规模的Pfam家族贡献新折叠子的概率分布.  相似文献   

14.
介绍了蛋白质序列相似性分析的进展,并以对酵母蛋白质所做的工作为例,详细说明了蛋白质序列相似性分析的过程和有关算法,阐明了将蛋白质的结构分析和功能预测结合起来对序列相似性分析的意义,还针对蛋白质结构分析和功能预测的方法,提出了一些目前存在的问题,作为以后研究工作的出发点。  相似文献   

15.
蛋白质结构与功能的研究一直是分子生物学研究的热点之一.基于混沌理论对蛋白质序列特性进行研究,先将蛋白质序列转为时间序列,再对其进行相空间重构,通过计算确定时间延迟t、嵌入维数m等参数,最后计算得出蛋白质序列的最大Lyapunov指数,通过对蛋白质结构分类数据库SCOP中七类蛋白质结构的蛋白质序列最大Lyapunov指数计算和比较,发现蛋白质整体序列和蛋白质结构没有明显关联.  相似文献   

16.
蛋白质是生物体内行使重要功能的生物大分子.蛋白质的功能是由其空间结构决定的,而蛋白质的空间结构取决于其一级序列.因此,研究蛋白质的氨基酸序列就成为蛋白质结构预测的前提和基础,并已经成为生物学家关注的主要研究内容之一.主要介绍基于20种氨基酸的一种5-L模型,将蛋白质序列粗粒化为5-L序列,进而给出蛋白质序列的一种3-D图形表示,称之为Cp曲线.将Cp曲线转化为容易比较的序列不变量,并在此基础上对11个物种β-球蛋白质序列进行相似性分析.  相似文献   

17.
生物信息学的基本任务是对各种生物分析序列进行分析,也就是研究新的计算机方法,从大量的序列信息中获取基因结构、功能和进化等知识,并将其存储于基因数据库中.而在序列分析中,将未知序列同基因数据库中已知序列进行相似性比较是一种强有力的研究手段,包括序列的片段测定、拼接,基因的表达分析,以及RNA和蛋白质的结构功能预测.  相似文献   

18.
运用RBF神经网络预测蛋白质相互作用位点.首先提取序列谱、保守权重、熵值、复合物可及表面积和序列变化率等一系列蛋白质相互作用位点的关键特征.然后应用RBF神经网络以及它们的集成来对这些样本集进行训练与测试.使用10次交叉验证进行训练与测试,创建了4组具有对比性的蛋白质相互作用特征组合.实验中每加入一种新的特征时正确预测率都会相应的提高,特别是加入可及表面积和序列变化率特征时正确率提高幅度更大,表明利用多特征组合,结合RBF神经网络算法进行预测蛋白质相互作用位点的方法是正确有效的.  相似文献   

19.
将一种新的智能计算方法——DNA计算引入到蛋白质结构预测中,试图建立当蛋白质结构与母板结构相似度比较低的情况下的蛋白质结构比较模型的DNA计算方法。将氨基酸序列中的一个残基的可能构型映射为一段DNA序列,将一个蛋白质结构预测问题转化成一个边赋权的图的最大权团问题,结合最大权团问题的DNA计算模型,建立蛋白质预测问题的DNA算法,并通过仿真实验说明了算法的有效性。  相似文献   

20.
蛋白质是由多个氨基酸组成的长链,是生物体的必要组成成分,参与了生命活动的每一个进程。蛋白质结构决定了许多蛋白质的功能,准确预测蛋白质中氨基酸残基接触对于蛋白质结构预测具有重要意义,蛋白质残基接触问题已经成为当前生物信息领域的热点问题。该文首先给出了蛋白质残基接触图预测的相关背景知识及其重要意义;其次,总结了当前国内外研究的主流方法,包括基于局部相关性的方法、直接耦合分析法与其后处理的方法、以及基于有监督机器学习的方法,并对其中的代表性方法进行了阐述;结合国际蛋白质结构预测竞赛(Critical assessment of protein structure prediction,CASP)的结果对现有模型的性能做了对比和分析;在此基础上,探讨了残基接触图预测在蛋白质结构功能建模中的应用;最后,针对蛋白质接触图预测中存在的若干难点问题,给出了有望取得突破的若干研究方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号