使预测准确度更高的496蛋白质数据训练集期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

使预测准确度更高的496蛋白质数据训练集

作者姓名：	刘明闫蓬勃刘建国

作者单位：	刘明（河北大学生命科学学院）;闫蓬勃（河北大学生命科学学院）;刘建国（河北大学生命科学学院）

基金项目：	教育部留学回国人员科研启动基金资助.

摘要：	实验对当今主流的3种蛋白质数据训练集进行了研究.目的是为了建立一个新的训练集从而能更准确的把蛋白质的每个氨基酸残基归类为正确的二级结构,例如,α螺旋、β折叠或无规则卷曲.在分析了传统的蛋白质数据训练集的数据结构以及研究了已发表的传统的训练集改良方法之后,独创性的实验设计出改良的496蛋白质数据训练集并且用LIBSVM(Support Vector Machine,支持向量机)来预测蛋白质二级结构,并且获得了最高的SOV预测准确度.LIBSVM是在统计学中应用于分类领域的一种程序,近年来的实验表明它十分适合应用干蛋白质二级结构分类预测领域,并且表现卓越.
关键词：	改良的蛋白质数据训练集 LIBSVM 蛋白质二级结构预测