摘 要: | 实验对当今主流的3种蛋白质数据训练集进行了研究.目的是为了建立一个新的训练集从而能更准确的把蛋白质的每个氨基酸残基归类为正确的二级结构,例如,α螺旋、β折叠或无规则卷曲.在分析了传统的蛋白质数据训练集的数据结构以及研究了已发表的传统的训练集改良方法之后,独创性的实验设计出改良的496蛋白质数据训练集并且用LIBSVM(Support Vector Machine,支持向量机)来预测蛋白质二级结构,并且获得了最高的SOV预测准确度.LIBSVM是在统计学中应用于分类领域的一种程序,近年来的实验表明它十分适合应用干蛋白质二级结构分类预测领域,并且表现卓越.
|