基于双向门控循环单元的5-甲基胞嘧啶位点预测 |
| |
引用本文: | 黄修威,方中纯,李海荣.基于双向门控循环单元的5-甲基胞嘧啶位点预测[J].中南民族大学学报(自然科学版),2023(6):768-774. |
| |
作者姓名: | 黄修威 方中纯 李海荣 |
| |
作者单位: | 1. 内蒙古科技大学信息工程学院;2. 内蒙古科技大学工程训练中心(创新创业教育学院) |
| |
基金项目: | 内蒙古自治区自然科学基金资助项目(2020MS06028);;内蒙古自治区高等学校科学研究项目资助项目(NJZY21387);;2020年教育部产学合作协同育人项目资助项目(202002107034); |
| |
摘 要: | 5-甲基胞嘧啶(5-methylcytosine, m5C)是一种重要的转录后修饰,大量证据表明,m5C在许多生物学过程中起着至关重要的作用.准确鉴定m5C位点有助于更好地了解其生物学功能.为此提出了一个名为pm5C-BGRU的模型,该模型通过拼接独热编码(One-hot encoding)和核苷酸化学性质(nucleotide chemical property, NCP)进而对RNA序列进行特征提取,并基于双向门控循环单元(Bidirectional Gated Recurrent Unit, BiGRU)来识别m5C位点.将该方法在人类、小鼠和拟南芥三个物种的m5C数据集上进行建模和测试,并对照已有的预测模型进行评估.结果表明,pm5C-BGRU在交叉验证和独立数据集测试中均取得优异效果,该模型有望成为鉴定m5C位点的有力工具.
|
关 键 词: | 5-甲基胞嘧啶 序列编码 双向门控循环单元 预测 |
|
|