基于深度学习与领域规则建模的蛋白质信号肽及其切割位点预测 |
| |
引用本文: | 张维洵,潘小勇,沈红斌.基于深度学习与领域规则建模的蛋白质信号肽及其切割位点预测[J].南京理工大学学报(自然科学版),2020,44(3). |
| |
作者姓名: | 张维洵 潘小勇 沈红斌 |
| |
作者单位: | 上海交通大学 图像处理与模式识别研究所,上海200240;上海交通大学 图像处理与模式识别研究所,上海200240;上海交通大学 图像处理与模式识别研究所,上海200240 |
| |
基金项目: | 国家自然科学基金;国家自然科学基金;国家自然科学基金 |
| |
摘 要: | 为了提升蛋白质信号肽及其切割位点预测精度,有效区分3种不同类型的信号肽,提出基于位置特异性打分矩阵(PSSM)和同源检测迭代的隐马尔科夫(HMM)文件的深度学习预测方法。设计基于自注意力机制的神经网络模型用于信号肽预测,并使用基于知识迁移的模型集成方法提升预测效果。设计基于门控循环单元(GRU)网络的条件随机场(CRF)来预测信号肽切割位点,并集成领域规则方法提升预测能力。实验结果表明,该文方法对革兰氏阴性菌和革兰氏阳性菌的Sec/SPI、Sec/SPII与Tat/SPI信号肽预测任务的平均马修斯相关系数(MCC)为0.962。该文方法对革兰氏阴性菌和革兰氏阳性菌的Sec/SPI、Sec/SPII与Tat/SPI信号肽切割位点预测任务的平均召回率和准确率分别为0.698和0.662。在部分信号肽样本上,该文方法能正确预测SignalP 5.0方法预测错误的样本,2种方法在切割位点的预测上存在着一定的互补性。
|
关 键 词: | 深度学习 领域规则 蛋白质 信号肽 知识迁移 门控循环单元 条件随机场 |
本文献已被 CNKI 万方数据 等数据库收录! |
|