融合单残基信息的U-RF算法识别SO42-和PO43-配体结合位点 |
| |
引用本文: | 陈少华,胡秀珍,胡慧敏,姚雨倩.融合单残基信息的U-RF算法识别SO42-和PO43-配体结合位点[J].内蒙古大学学报(自然科学版),2024(2):183-192. |
| |
作者姓名: | 陈少华 胡秀珍 胡慧敏 姚雨倩 |
| |
作者单位: | 内蒙古工业大学理学院 |
| |
基金项目: | 国家自然科学基金项目(61961032); |
| |
摘 要: | SO42-和PO43-配体与蛋白质相结合在生命活动中起着重要的作用,因此,准确预测蛋白质-酸根离子配体结合残基具有重要意义。前人对酸根离子配体结合位点的研究多数是在片段水平上进行的,而极少考虑单残基水平,这可能导致信息的缺失。因此,在片段和单残基水平两个方面提取特征,可以避免信息丢失。在片段水平上使用前人对氨基酸、二级结构、相对溶剂可及性和亲疏水提取的组分信息和位点保守信息作为基础特征,在此基础上引入了单残基水平上的氨基酸、氨基酸的酸碱极性、能量及亲疏水的倾向性因子;结合残基左右残基对信息和9个正交因子为新的特征,使用欠采样和随机森林相融合的算法(U-RF)进行五交叉检验和独立检验,得到了好于前人的预测结果。
|
关 键 词: | 结合残基 单残基水平 倾向性因子 酸碱极性 左右残基对信息 |
|
|