基于剪接信号和调节元件序列特征的剪接位点预测方法 |
| |
引用本文: | 孙宗晓,桑凌洁,居理宁,朱怀球.基于剪接信号和调节元件序列特征的剪接位点预测方法[J].科学通报,2008,53(19):2298-2306. |
| |
作者姓名: | 孙宗晓 桑凌洁 居理宁 朱怀球 |
| |
作者单位: | 北京大学工学院湍流与复杂系统国家重点实验室,生物医学工程系,理论生物学中心 |
| |
基金项目: | 国家重点基础研究发展计划(编号: 2003CB715905)、国家自然科学基金(批准号: 30300071, 30770499, 10721403)及北京大学工学院青年人才基金资助项目 |
| |
摘 要: | 结合剪接相关的剪接信号和调节元件的序列特征信息, 发展高效的剪接位点预测方法, 是真核生物基因预测中一个新课题. 运用熵密度分布(EDP)距离方法、权重数组法(WAM)、κ检验等算法建立了剪接位点相关的剪接信号的统计模型, 同时基于无监督自学习的基序检测方法建立了调节元件的统计模型, 在此基础上设计了基于多层次支持向量机(SVM)的剪接位点预测新算法, 实现了真核基因剪接位点的从头(ab initio)预测. 对人类基因组剪接位点数据的大规模测试结果表明, 本研究提出的方法能够有效地预测人类基因组中的剪接位点, 预测水平不仅全面高于传统的基于剪接信号的预测方法GeneSplicer, 而且在总体预测精度上达到并大部分超过基于调节元件信号的预测方法SpliceScan. 对于低GC含量的基因序列, 本文方法的预测精度明显地高于其他两种方法.
|
关 键 词: | 基因预测 剪接位点 剪接信号 调节元件 |
收稿时间: | 2008-04-08 |
修稿时间: | 2008-07-03 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《科学通报》浏览原始摘要信息 |
| 点击此处可从《科学通报》下载免费的PDF全文 |
|