首页 | 本学科首页   官方微博 | 高级检索  
     检索      

蛋白质中三联氨基酸数与二级结构数的模型研究
引用本文:朱尔一.蛋白质中三联氨基酸数与二级结构数的模型研究[J].厦门大学学报(自然科学版),2009,48(5).
作者姓名:朱尔一
作者单位:厦门大学,化学化工学院,现代分析科学重点实验室,福建,厦门361005
基金项目:福建省自然科学基金,近海海洋环境科学国家重点实验室(厦门大学)开放项目资助 
摘    要:蛋白质的一级结构或序列与二级结构的关系在蛋白质结构研究中是很重要的,通过建立模型的方法来研究这种关系.在文献中已有的模型(蛋白质一级结构中的二联氨基酸与蛋白质二级结构的模型)的基础上,建立了蛋白质一级结构中的三联氨基酸个数与蛋白质二级结构个数模型.该模型能够较准确地反映蛋白质的一级结构或序列与蛋白质的二级结构的关系,比较适合应用于氨基酸序列长度变化较大的建模数据,同二联氨基酸与二级结构模型比较,由于三联氨基酸含有更多氨基酸之间的耦合信息,该模型的拟合精度更高.由于蛋白质一级结构中的三联氨基酸的种类数很大(为4 200),用以建模的变量数就很大,同时从DSSP数据库得到的样本量也很大(为11 600),用以建模的数据量很大.研究结果表明,PLS变量筛选法是一种建立大数据模型有效的方法,可有效地处理变量数为4 200,样本数为11 600这样大数据量的建模问题.

关 键 词:蛋白质二级结构预测  偏最小二乘法变量筛选  海量数据建模  三联氨基酸

The Model Study Between the Number of Tria-coupled Amino Acid and the Number of Protein Secondary Structure
ZHU Er-yi.The Model Study Between the Number of Tria-coupled Amino Acid and the Number of Protein Secondary Structure[J].Journal of Xiamen University(Natural Science),2009,48(5).
Authors:ZHU Er-yi
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号