首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 656 毫秒
1.
蛋白质的二级结构序列和结构型   总被引:1,自引:0,他引:1  
从蛋白质的二级结构序列出发 ,提出了冗余的概念 ,定义了冗余数量和冗余长度 ,给出了不同结构型蛋白的冗余数量和长度的分布特性 .统计结果表明 α类蛋白中 30 %、β类蛋白中84 %、α/β类蛋白中 95 %的序列不同程度的存在冗余 ,冗余数量和冗余长度主要分布在 1~ 3的范围 .以主二级结构序列三联体为参数 ,利用信息聚类方法对 α类、β类、α/ β类、α β类的6 0 0个蛋白进行了聚类 ,结果表明 ,对冗余较少的α类蛋白 85 %以上能够较好地聚类在一枝中 ,但对于冗余较多的其它类蛋白不能分在一个大支中 ,大部分可以分散在多个小支中 .以主二级结构序列三联体为参数 ,利用 Mahalanobis距离方法对上述四种结构型进行预测 ,预测的总体准确率为 81 .1 % .聚类结果和利用 Mahalanobis距离分类结果充分展示了蛋白质二级结构序列对结构型的特殊作用 ,但由于冗余的影响使得二级结构序列的信息并未充分显示出来 .说明从蛋白质二级结构序列出发预测结构型和构建蛋白质框架结构是合理的选择  相似文献   

2.
提出一种蛋白质二级结构预测的新方法.该方法首先对数据集中的氨基酸序列利用PSI-BLAST程序进行同源序列搜索,得到相应的PSSM矩阵,然后利用滑动窗口方法对矩阵进行编码,得到分类器的输入.采用分类器集成,将所有的样本划分成9个互斥训练集对单个子分类器进行训练.然后,9个单独的0-1子分类器通过最大投票法进行集成,形成识别一种特定的蛋白质二级结构的0-1分类器.这样3个0-1分类器模型通过串行集成,可以对蛋白质的三种二级结构(H/E/C)进行识别.通过对标准数据集RS126,CB396,CB513进行测试发现,对于同一分类器,利用PSSM矩阵作为分类器输入的预测准确率要高于直接将蛋白质序列作为输入的预测率.  相似文献   

3.
连续小波变换在蛋白质结构预测中的应用   总被引:1,自引:0,他引:1  
将代码为3pgal蛋白质的氨基酸序列映射为疏水值序列,在合适的尺度下,通过连续小波变换方法可对其非规则二级结构进行预测,淮确率为83.3%。从PDBsum数据库中随机抽取100个蛋白质作为测试对象,经本法处理后,1853个非规则二级结构中有1424个能被淮确预测到,平均预测淮确率为76.8%。结果表明:该法可较好地预测蛋白质的非规则二级结构,具有极大的发展前景。  相似文献   

4.
为提高蛋白质二级结构预测的精度,提出了一个由5个子网络集成的多模神经网络模型,预测结果由5个子网络综合得到。对于每个子网络采用神经网络分级思想分为二级网络,一级网络采用含进化信息的profile编码蛋白质序列作为输入,二级结构作为输出。二级网络编码一级网络输出结果作为输入,并将蛋白质序列用改进正交编码方式作为另一输入来提高二级网络的预测精度,输出仍为二级结构。采用子网络差异方式进行单独训练,结果表明该方法最终的预测精度达到71.3%,较大提高了蛋白质二级结构的预测精度。  相似文献   

5.
在传统的Chou-Fasman蛋白质二级结构预测方法的基础上引入同义密码子使用的信息,计算了200个蛋白(49种全α结构蛋白,69种全β结构蛋白,38种仅α β结构蛋白,44种α/β结构蛋白)中不同密码子对应的氨基酸形成不同二级结构(α:螺旋,β:折叠,C:卷曲)的偏向性参数.通过对这些密码子对应氨基酸二级结构偏向性的分析,得到了氨基酸二级结构偏向性分析中所忽略的同义密码子的蛋白结构信息.这些新的信息量对于指导蛋白质设计以及提高蛋白质二级结构预测的准确率有着一定的作用.  相似文献   

6.
神经网络预测蛋白质二级结构的编码技术   总被引:2,自引:0,他引:2  
考虑不同残基的物理化学性质,将其融入蛋白质二级结构的神经网络预测中,提出了一种新的归一化二进制编码技术,将各种残基不同的疏水值与体积大小归一化结果作为神经网络的二进制输入序列.与其他蛋白质二级结构预测的方法进行了比较,结果表明,该方法能充分利用蛋白质的一级结构信息,获得了很好的预测效果。  相似文献   

7.
基于小波分析法的蛋白质结构研究   总被引:3,自引:0,他引:3  
用小波的方法预测了一个已知结构蛋白质的二级结构,并把它同互连网蛋白质结构预测服务及其他结构预测软件得到的二级结构进行比较。结果表明:该方法可以较好地确定蛋白质的二级结构且不必进行同源蛋白质序列的联配。在预测未知结构的蛋白质序列方面,该方法与其他方法相比,预测结果并无显著差异,这说明小波分析法可以用于蛋白质结构研究,若与其他方法结合用于结构预测,将会起到更好的作用。  相似文献   

8.
本文在工作[1][2]的基础上进一步研究了蛋白质二级结构的经验预测,着重讨论了如何制定预测规则的问题,并将预测工作计算机化.在蛋白质资料库中随机选取了21个蛋白质(3296残基)进行预测,正确率对α螺旋和β折迭分别为84.4%和81.9%.  相似文献   

9.
蛋白质二级结构预测时,描述窗口内氨基酸残基序列的各种物理化学和分子结构参数的数量非常大,而且不能很好地直接体现氨基酸的连接顺序,这样就造成二级结构预测工作既费时效果又低下,因此,对这些数据预处理是非常必要的.研究发现,这些初始数据对应的变换矩阵的本征值谱与氨基酸残基序列情况无关,只与氨基酸的类别、数量性质有关,而其本征函数数据能够直接反映氨基酸残基的序列情况,利用有显著大小的本征值对应的本征函数作为描述参数,在进行蛋白质二级结构预测时,不但能够显著减少描述参数的个数,而且它体现了氨基酸顺序的变化,这将有效提高蛋白质二级结构预测研究效果.  相似文献   

10.
氨基酸分类与蛋白质二级结构相关性   总被引:7,自引:0,他引:7  
从氨基酸序列和蛋白质二级结构相关性出发 ,定义信息剩余度 ,通过信息剩余度极大化 ,推导出从 2 0组到 2组的氨基酸分类结果 ,同时也得到了信息剩余度极大值 (RMAX)与约化次数的关系  相似文献   

11.
蛋白质二级结构预测是三级结构预测的一个非常重要的中间步骤,而折叠子识别和结构类型的准确预测则可以提高二级结构和三级结构预测的准确度.本文从蛋白质的一级序列出发,提出了一种改进的预测算法:以二肽组分、预测的二级结构信息、伪氨基酸组分和位置权重矩阵打分值等特征分别作为参数,输入离散增量算法的单分类器中,通过加权融合单分类器的计算结果,对27类折叠子的结构类型进行了预测,取得了较好的预测结果.  相似文献   

12.
[目的]由于经济、金融、环境和生态等多个领域中时间序列数据规模的持续增长,对其进行预测变得日益复杂,为了提高大规模时间序列的长期预测效率,探索构建模糊信息粒的创新方法,以准确反映数据集大小和趋势信息.[方法]首先,根据模糊拓展原理,研究各种模糊信息粒,包括区间型、三角型和高斯型模糊信息粒的距离定义.随后,结合时间序列片段的中心线段和离散程度信息,引入一类新颖的模糊信息粒.这些粒子可以有效捕捉指定时间范围内时间序列的趋势信息和离散程度,进一步地提出高斯型模糊信息粒距离的函数表达式和几何解释.为了将这些粒子用于时间序列预测,设计一类模糊推理预测系统,该系统可以利用历史数据构造模糊信息粒,并从高斯型模糊信息粒序列中提取模糊推理规则.[结果]高斯型模糊信息粒距离的函数表达式具有简洁的数学表示,可以合理地反映两个高斯模糊信息粒的中心线和离散程度的差异.模糊推理预测系统可以从高斯型模糊信息粒序列中提取有效的规则,实现时间序列的长期预测.实验结果表明,结合线性高斯模糊信息粒与模糊推理系统的预测方法在均方根误差和平均绝对百分比误差方面优于其他数值预测算法和其他模糊信息粒推理方法,包括自回归模型、自回归...  相似文献   

13.
提出了由蛋白质二级结构序列预测蛋白质结构类的新方法,并给出了预测蛋白质结构类的简明预测规则。  相似文献   

14.
蛋白质拓扑结构预测的进一步讨论   总被引:5,自引:4,他引:1  
利用信息论方法,找到了与蛋白质拓扑结构相关性较好的一些二级结构参数,确定了预测蛋白质拓扑结构的最佳参数、对α类,β类,α/β类蛋白制定了简洁的预测规则;对结果进行了讨论。  相似文献   

15.
提出一种预测蛋白质二级结构的模式识别方法。该法首先对大量已知结构的蛋白质实验数据进行分析,找出鉴别蛋白质不同结构成分的有效信息,即设计分类器,然后实现对未知蛋白质二级结构的预测。用此方法对640个实验样本进行了研究,得到较高的预测精度,表明方法是有效的。还对实验结果进行了分析;讨论了有限样本对分类器性能的影响。  相似文献   

16.
基于序列预测二级结构的蛋白质折叠速率的成功预测暗示着折叠速率能够单独从序列中预测出来.为了追踪这一问题,提出了从序列预测折叠速率的一种方法,而不需要任何二级结构和拓扑的信息.残基对折叠速率的影响与氨基酸的性质有密切的关系.对双态和多态蛋白质实验测定的折叠速率的相关性达到了82.9%,这意味着蛋白质的氨基酸序列是决定折叠速率和机理的重要因素.  相似文献   

17.
为研究蛋白质二级结构预测时采用哪种氨基酸编码方式具有更好的预测精度,使用正交编码、5位编码、Codon编码(2种)和Profile编码等5种不同的氨基酸编码方式,并用SVM(支持向量机)进行蛋白质二级结构预测.实验结果表明,经过多重序列比对,包含更多生物进化信息的Profile编码方式的预测精度比起其他4种编码方式高出19.4%~23.9%.  相似文献   

18.
以蛋白质二级结构含量为基础利用Mahalanobis距离和以蛋白质二级结构序列建立数学模型相结合的方法来预测α型、β型、α+β型和α/β型四种蛋白质结构型。  相似文献   

19.
α/β类蛋白的构建模式及拓扑结构预测   总被引:4,自引:4,他引:0  
讨论了α/β类蛋白的构建模式及拓扑分类,根据二级结构序列给α/β类蛋白拓扑结构预测的简明规则,预测成功率在80%以上。  相似文献   

20.
基于扩展的层次有色petri网的组合服务测试用例生成   总被引:1,自引:0,他引:1  
为了更好地对Web组合服务中各个服务间的交互行为进行测试,提出了一种基于扩展的层次有色petri网的组合服务测试用例生成方法.首先将OWL-S文档映射成为扩展的层次有色petri网,使其中丰富的语义信息、数据流信息和控制流信息模型化.然后利用扩展的层次有色petri网,着重对各服务之间的数据流关系进行分析,找到所有的输出输入定义使用链,并将其扩展成可执行的测试序列,最后将测试序列和测试数据组合,生成测试用例.其中生成的所有测试序列符合全定义一使用路径覆盖标准.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号