首页 | 本学科首页   官方微博 | 高级检索  
     检索      

GM12878细胞系CTCF活性结合位点的预测
引用本文:刘影,张利绒.GM12878细胞系CTCF活性结合位点的预测[J].内蒙古大学学报(自然科学版),2020,51(2):141-147.
作者姓名:刘影  张利绒
作者单位:内蒙古大学物理科学与技术学院,呼和浩特010021;内蒙古大学物理科学与技术学院,呼和浩特010021
基金项目:国家自然科学基金;新疆维吾尔自治区自然科学基金
摘    要:转录因子的结合能够影响下游目标基因在特定时间、空间的转录和表达.转录因子结合具有细胞特异性,受到染色质开放特征、多种组蛋白修饰以及其他转录因子结合等多种因素影响.以GM12878细胞系为研究对象,构建了CTCF活性结合位点数据集(正集,876个位点)与非活性结合位点数据集(对照组,负集,231130个位点)。根据DNase-seq、H3k4me2、H4k20me1、H3K4me3、H3K27me3、H3K9me3、H3K9ac、RAD21、SMC3这九种特征,分别利用支持向量机(SVM,Jackknife检验)和随机森林(RF,5-fold交叉验证)这两种方法,对CTCF的活性结合位点进行预测,九种特征融合的预测准确度分别达到93.87%和94.46%,平均预测的准确度分别是94.78%和95.40%。结果显示,这九种特征对GM12878细胞系转录因子CTCF的结合具有重要的调控作用,而SMC3的结合对CTCF结合的调控尤为重要。

关 键 词:CTCF  活性  非活性  结合位点  预测
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号