次要等位基因频率筛选阈值对人类单体型图精度的影响: 基于中国汉族与藏族人群测序数据的比较 |
| |
作者姓名: | 熊诗诣 郝元涛 饶绍奇 黄玮俊 胡彬 拉布 普布卓玛 格桑卓嘎 王一鸣 |
| |
作者单位: | ① 中山大学中山医学院医学遗传教研室, 广州 510089; ② 中山大学公共卫生学院医学统计与流行病学系, 广州 510089; ③ 西藏自治区第二医院妇产科, 拉萨 850002 |
| |
基金项目: | 教育部“985工程”二期、广东省自然科学基金(批准号: 031673)、广州市科技计划基金(批准号: 2002Z3-C7191, 2004Z3-C7501)资助项目 |
| |
摘 要: | 基因组变异是个体间疾病易感性和药物反应等表型多样性的遗传基础. 国际人类单体型图(International HapMap)旨在为复杂疾病相关遗传变异的研究提供路线图. 单核苷酸多态性(SNPs)是HapMap的基本要素. SNPs等位基因频率影响连锁不平衡结构、单体型的构建、标签SNPs的筛选, 是影响HapMap精度的主要因素之一. 因此, 次要等位基因频率筛选阈值的选择对图谱精度有深远影响. 迄今大多数研究者选用自定的阈值, 且鲜有针对次要等位基因频率筛选阈值对HapMap精度影响的研究. 为探讨次要等位基因频率筛选阈值对相应HapMap精度的影响, 本研究用中国汉、藏族人群15号染色体中心粒区域基因的测序结果按不同次要等位基因频率筛选阈值(≥0.01, ≥0.05, ≥0.10)将以往的数据分成了3组, 即0.01组、0.05组以及0.10组, 分别构建了3组数据的HapMap, 并比较了各组HapMap精度、关联分析的研究效能及节约/总成本比值. 结果显示, 0.01组有最高的关联分析研究效能(相比0.05组: 汉族, P = 0.019; 藏族, P = 0.029), 并捕获了最多的人群特异性单体型(相比0.05组, P = 0.012). 在所检区域内, 与0.10阈值相比, 0.05阈值并没有显著提高关联分析的研究效能(汉族, P = 0.191; 藏族, P = 1.000)及人群特异性单体型的捕获(P = 0.592). 同时, 在藏族人群中, 0.05与0.10组产生了相同数据的标签SNPs效率、连锁不平衡结构域的数目和平均长度、关联分析研究效能及节约/总成本比值. 结果提示, 较低的次要等位基因频率筛选阈值更适合着重于人群特异性单体型的研究; 不同人群最佳次要等位基因频率筛选阈值可能不尽相同. 由于本研究检测基因数目有限, 这一重要议题仍需更多深入的探讨.
|
关 键 词: | 单体型图 次要等位基因频率筛选阈值 单体型图精度 |
收稿时间: | 2009-01-12 |
修稿时间: | 2009-03-27 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《科学通报》浏览原始摘要信息 |
|
点击此处可从《科学通报》下载全文 |
|