首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 312 毫秒
1.
本文将Zimm-Bragg模型推广到实际多肽链,建立了蛋白质二级结构的统计力学形式,着重讨论了如何依据统计力学预测蛋白质二级结构的问题。  相似文献   

2.
蛋白质二级结构与蛋白质三级结构及蛋白质功能密切相关,是生物信息学研究的热点,其中概率图模型隐马尔可夫算法(HMM)是该领域研究的重要工具。但是在实际应用中,存在着HMM训练下溢、不同训练集的效果差异较大及参数优化困难等问题。对预测蛋白质二级结构时HMM遇到的训练下溢问题提出了改进方案;首次提出8-状态HMM来预测蛋白质二级结构,并且将参数B改进成为包含状态转移信息的三维参数;为了改进最优HMM模型的确定方法,用每个样本分别对初始HMM模型进行训练,得到一系列新的模型,然后对这些新模型的参数求均值,将求得的均值作为最优模型的参数。这些改进方法提高了HMM预测蛋白质二级结构的准确率,为HMM的进一步优化打下良好的基础。  相似文献   

3.
针对水稻蛋白质二级结构预测研究,查阅了国家水稻数据中心文献资源,基于国际蛋白质数据库(protein data bank, PDB),选择具有代表性的蛋白质(5XQI)作为样本,应用BP神经网络建模技术,对水稻蛋白质二级结构进行预测研究。结果表明:先用氨基酸描述子量化一级结构,再用主成分分析综合描述子,能简化模型结构,提高模拟预测准确度和运行速度;构建标量型的人工神经网络模型和仿真函数预测式,简捷直观,应用方便;适宜的模型结构为21∶20∶3,即21个输入层节点、20个隐含层神经元、3个输出层神元的BP神经网络模型结构;模型的整体拟合准确度为0.85,H、E、C三种二级结构的拟合准确度分别为0.92、0.79、0.81;整体预测准确度为0.72,三种二级结构的预测准确度分别为0.79、0.65、0.71。基于BP神经网络的水稻蛋白质二级结构预测模型的拟合、预测准确度比以往同类研究高,为水稻蛋白质二级结构预测提供了一种新的研究方法。  相似文献   

4.
为提高蛋白质二级结构预测的精度,提出了一个由5个子网络集成的多模神经网络模型,预测结果由5个子网络综合得到。对于每个子网络采用神经网络分级思想分为二级网络,一级网络采用含进化信息的profile编码蛋白质序列作为输入,二级结构作为输出。二级网络编码一级网络输出结果作为输入,并将蛋白质序列用改进正交编码方式作为另一输入来提高二级网络的预测精度,输出仍为二级结构。采用子网络差异方式进行单独训练,结果表明该方法最终的预测精度达到71.3%,较大提高了蛋白质二级结构的预测精度。  相似文献   

5.
基于小波分析法的蛋白质结构研究   总被引:3,自引:0,他引:3  
用小波的方法预测了一个已知结构蛋白质的二级结构,并把它同互连网蛋白质结构预测服务及其他结构预测软件得到的二级结构进行比较。结果表明:该方法可以较好地确定蛋白质的二级结构且不必进行同源蛋白质序列的联配。在预测未知结构的蛋白质序列方面,该方法与其他方法相比,预测结果并无显著差异,这说明小波分析法可以用于蛋白质结构研究,若与其他方法结合用于结构预测,将会起到更好的作用。  相似文献   

6.
基于改进BP神经网络预测蛋白质二级结构   总被引:6,自引:0,他引:6  
蛋白质结构预测在生物信息学研究中占有重要地位,而蛋白质二级结构预测是蛋白质结构预测的关键步骤。针对标准BP算法存在的缺点,讨论采用几种不同的改进BP神经网络来实现蛋白质二级结构的预测,运用MATLAB语言实现各种改进算法的初始化和训练。并分析比较了它们对蛋白质二级结构预测精度的影响。实验表明,遗传算法结合动量法与学习率自适应调整策略的BP算法可获得较高的预测精度。  相似文献   

7.
提出了由蛋白质二级结构序列预测蛋白质结构类的新方法,并给出了预测蛋白质结构类的简明预测规则。  相似文献   

8.
一定氨基酸序列顺序排列的多肽链是如何形成有一定空间结构的蛋白质分子的问题仍是分子生物学中心法则中到目前为止还悬而未决的问题.所以预测蛋白质的三级结构是分子生物学迫切需要解决的问题之一.一般认为蛋白质的结构是由其氨基酸序列所决定的,但我们现在所拥有的知识还不足以对蛋白质的三级结构准确地预测.因而在此之前准确预测蛋白质二级结构对于预测蛋白质三级结构有着重要的意义[1,2].  相似文献   

9.
蛋白质的一级结构或序列与二级结构的关系在蛋白质结构研究中是很重要的,通过建立模型的方法来研究这种关系.在文献中已有的模型(蛋白质一级结构中的二联氨基酸与蛋白质二级结构的模型)的基础上,建立了蛋白质一级结构中的三联氨基酸个数与蛋白质二级结构个数模型.该模型能够较准确地反映蛋白质的一级结构或序列与蛋白质的二级结构的关系,比较适合应用于氨基酸序列长度变化较大的建模数据,同二联氨基酸与二级结构模型比较,由于三联氨基酸含有更多氨基酸之间的耦合信息,该模型的拟合精度更高.由于蛋白质一级结构中的三联氨基酸的种类数很大(为4 200),用以建模的变量数就很大,同时从DSSP数据库得到的样本量也很大(为11 600),用以建模的数据量很大.研究结果表明,PLS变量筛选法是一种建立大数据模型有效的方法,可有效地处理变量数为4 200,样本数为11 600这样大数据量的建模问题.  相似文献   

10.
基于序列预测二级结构的蛋白质折叠速率的成功预测暗示着折叠速率能够单独从序列中预测出来.为了追踪这一问题,提出了从序列预测折叠速率的一种方法,而不需要任何二级结构和拓扑的信息.残基对折叠速率的影响与氨基酸的性质有密切的关系.对双态和多态蛋白质实验测定的折叠速率的相关性达到了82.9%,这意味着蛋白质的氨基酸序列是决定折叠速率和机理的重要因素.  相似文献   

11.
本文在工作[1][2]的基础上进一步研究了蛋白质二级结构的经验预测,着重讨论了如何制定预测规则的问题,并将预测工作计算机化.在蛋白质资料库中随机选取了21个蛋白质(3296残基)进行预测,正确率对α螺旋和β折迭分别为84.4%和81.9%.  相似文献   

12.
神经网络预测蛋白质二级结构的编码技术   总被引:2,自引:0,他引:2  
考虑不同残基的物理化学性质,将其融入蛋白质二级结构的神经网络预测中,提出了一种新的归一化二进制编码技术,将各种残基不同的疏水值与体积大小归一化结果作为神经网络的二进制输入序列.与其他蛋白质二级结构预测的方法进行了比较,结果表明,该方法能充分利用蛋白质的一级结构信息,获得了很好的预测效果。  相似文献   

13.
蛋白质二级结构预测是三级结构预测的一个非常重要的中间步骤,而折叠子识别和结构类型的准确预测则可以提高二级结构和三级结构预测的准确度.本文从蛋白质的一级序列出发,提出了一种改进的预测算法:以二肽组分、预测的二级结构信息、伪氨基酸组分和位置权重矩阵打分值等特征分别作为参数,输入离散增量算法的单分类器中,通过加权融合单分类器的计算结果,对27类折叠子的结构类型进行了预测,取得了较好的预测结果.  相似文献   

14.
将ELM应用到蛋白质二级结构模型的训练中,在此基础上提出了基于概率的合并算法(probability-based combining,PBC),用该算法预测结果的合并.根据生物学中关于蛋白质二级结构的特征提出了预测结果的Helix-后处理(Helix-post-processing,HPP)算法,对合并后的预测结果进行有效的后处理,从而进一步提高预测结果的准确率.分别在CB513和RS126两个数据集上进行了实验,实验结果表明,预测结果的准确率是令人满意的,尤其是实现了训练时间上的显著缩短.  相似文献   

15.
蛋白质二级结构预测中的简化编码技术   总被引:2,自引:0,他引:2  
神经网络用于蛋白质二级结构预测时,通常氨基酸序列采用正交二进制编码。基于不同残基间的物理化学性质,提出了简化的编码技术,并与其他蛋白质二级结构预测的方法进行了比较。实施结果表明:这种方法更充分地利用了蛋白质一级结构的信息,有较好的效果。  相似文献   

16.
提出一种预测蛋白质二级结构的模式识别方法。该法首先对大量已知结构的蛋白质实验数据进行分析,找出鉴别蛋白质不同结构成分的有效信息,即设计分类器,然后实现对未知蛋白质二级结构的预测。用此方法对640个实验样本进行了研究,得到较高的预测精度,表明方法是有效的。还对实验结果进行了分析;讨论了有限样本对分类器性能的影响。  相似文献   

17.
从概率论的角度出发,以人和大肠杆菌蛋白质为模式,研究了蛋白质二级结构中有显著统计意义的mRNA序列上的密码子上下文关联,以及蛋白质序列上的氨基酸上下文关联.从而给出了99%置信水平上的各二级结构中的反常密码子上下文关联偏好型.为了进一步检查反常密码子关联对二级结构的影响是否有位点保守性,研究了密码子上下文关联以及氨基酸上下文关联与二级结构位点的关系,结果显示反常密码子关联与二级结构位点没有强关联.所得结果可以给出哪些密码子的上下文关联对蛋白质二级结构有影响,且对改进蛋白质二级结构的预测有一定的参考价值.  相似文献   

18.
在传统的Chou-Fasman蛋白质二级结构预测方法的基础上引入同义密码子使用的信息,计算了200个蛋白(49种全α结构蛋白,69种全β结构蛋白,38种仅α β结构蛋白,44种α/β结构蛋白)中不同密码子对应的氨基酸形成不同二级结构(α:螺旋,β:折叠,C:卷曲)的偏向性参数.通过对这些密码子对应氨基酸二级结构偏向性的分析,得到了氨基酸二级结构偏向性分析中所忽略的同义密码子的蛋白结构信息.这些新的信息量对于指导蛋白质设计以及提高蛋白质二级结构预测的准确率有着一定的作用.  相似文献   

19.
提出由蛋白质二级结构序列预测拓扑结构的方案,对全a全β和α/β型蛋白质制定了预测规则,预测成功率为85%~90%。  相似文献   

20.
提出由蛋白质二级结构序列预测拓扑结构的方案,对全α全β和α/β型蛋白质制定了预测规则.预测成功率为85%~90%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号