摘 要: | 【目的】考察秀丽隐杆线虫(Caenorhabditis elegans)基因组编码区(Coding sequences,CDSs)的碱基使用特点,并提炼出能够区分CDSs与非编码区的碱基成分偏移特征参数。【方法】在研究碱基成分偏移特性基础上,定义一个新的参数d,探索d值的分布规律;采用从秀丽隐杆线虫基因组6类不同的DNA序列中随机抽样的方式,分析并验证该指标作为基因组CDSs特征参数的可行性。【结果】参数d经过线性变换后近似服从对数正态分布;抽样分析显示分别有81.6%的CDSs、70.7%的外显子、21.8%的内含子、4.7%的随机序列、17.8%的5′非翻译区和31.4%的3′非翻译区落在d值变换后的特征取值区间内,即被预测为基因组CDSs。【结论】碱基成分偏移指数d可以作为表征基因组编码区的特征参数,它的特定取值区间能很好地区分CDSs(或开放阅读框及它的子片段)和其他非编码区。
|