GM12878细胞系CTCF活性结合位点的预测 |
| |
引用本文: | 刘影,张利绒.GM12878细胞系CTCF活性结合位点的预测[J].内蒙古大学学报(自然科学版),2020,51(2):141-147. |
| |
作者姓名: | 刘影 张利绒 |
| |
作者单位: | 内蒙古大学物理科学与技术学院,呼和浩特010021;内蒙古大学物理科学与技术学院,呼和浩特010021 |
| |
基金项目: | 国家自然科学基金;新疆维吾尔自治区自然科学基金 |
| |
摘 要: | 转录因子的结合能够影响下游目标基因在特定时间、空间的转录和表达.转录因子结合具有细胞特异性,受到染色质开放特征、多种组蛋白修饰以及其他转录因子结合等多种因素影响.以GM12878细胞系为研究对象,构建了CTCF活性结合位点数据集(正集,876个位点)与非活性结合位点数据集(对照组,负集,231130个位点)。根据DNase-seq、H3k4me2、H4k20me1、H3K4me3、H3K27me3、H3K9me3、H3K9ac、RAD21、SMC3这九种特征,分别利用支持向量机(SVM,Jackknife检验)和随机森林(RF,5-fold交叉验证)这两种方法,对CTCF的活性结合位点进行预测,九种特征融合的预测准确度分别达到93.87%和94.46%,平均预测的准确度分别是94.78%和95.40%。结果显示,这九种特征对GM12878细胞系转录因子CTCF的结合具有重要的调控作用,而SMC3的结合对CTCF结合的调控尤为重要。
|
关 键 词: | CTCF 活性 非活性 结合位点 预测 |
本文献已被 CNKI 万方数据 等数据库收录! |
|