首页 | 本学科首页   官方微博 | 高级检索  
     检索      

脊椎动物基因注释中的大基因问题
引用本文:王俊,李胜霆,张勇,郑洪坤,徐昭,叶葭,于军,黄家树.脊椎动物基因注释中的大基因问题[J].世界科技研究与发展,2003,25(6):42-50.
作者姓名:王俊  李胜霆  张勇  郑洪坤  徐昭  叶葭  于军  黄家树
作者单位:1. 中国科学院北京基因组研究所,北京,101300;浙江大学沃森基因组科学研究院,暨浙江省重点实验室,杭州华大基因研究发展中心,杭州,310007
2. 中国科学院北京基因组研究所,北京,101300
3. 中国科学院北京基因组研究所,北京,101300;北京大学生命科学院,北京,100871
摘    要:为了找出编码蛋白质的基因,注释流程结合了“从头开始的基因预测方法”和“与已知基因相似性比较”这两种方法。“从头开始的基因预测方法”虽然有很高的假阳性但是假阴性却很低;相形之下,结合了相似性比对的方法之后虽然能够降低假阳性,但是却大大提高了假阴性。我们发现,在这当中与基因预测正确率相关的最重要因素就是基因大小(包括内含子在内)——大基因尤其容易产生预测错误。

关 键 词:脊椎动物  基因注释  编码蛋白质  假阳性  假阴性  基因预测  大基因

Vertebrate Gene Predictions and the Problem of Large Genes
WANG Jun LI Shengting ZHANG Yong ZHENG Hongkun XU Zhao YE Jia YU Jun HUANG Jiashu.Vertebrate Gene Predictions and the Problem of Large Genes[J].World Sci-tech R & D,2003,25(6):42-50.
Authors:WANG Jun LI Shengting ZHANG Yong ZHENG Hongkun XU Zhao YE Jia YU Jun HUANG Jiashu
Abstract:To find unknown protein-coding genes, annotation pipelines use a combination of ab initio gene prediction and similarity to experimentally confirmed genes or proteins. Here, we show that although the ab initio predictions have an intrinsically high false-positive rate, they also have a consistently low false-negative rate. The incorporation of similarity information is meant to reduce the false-positive rate, but in doing so it increases the false-negative rate. The crucial variable is gene size {including introns) -genes of the most extreme sizes, especially very large genes, are most likely to be incorrectly predicted.
Keywords:gene prediction  false positive  false negative  large gene
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号