摘 要: | 针对图神经网络(GNN)ProteinSolver结构特征约束不充分的问题,增加了骨架二面角、配对氨基酸的相对位置编码和相对方向等结构约束,提出了一种基于GNN的固定骨架蛋白质设计方法。实现了基于Transformer多头注意力机制的GNN架构,将物理坐标添加到消息传递和更新步骤中,提高了原子坐标的等变特性。在CATH数据集上的训练和测试结果显示:该文模型平均困惑度为8.12,比ProteinSolver的平均困惑度8.97降低了0.85;在掩盖率为50%时,ProteinSolver的恢复率为28.7%;然后,增加更多的结构约束,恢复率达到了30.3%;随后,将ProteinSolver的GNN替换成基于Transformer的GNN,恢复率达到了34.3%;最后,通过再引入等变特性,恢复率进一步提高到35.0%。
|