首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
精神分裂症(Schizophrenia)是一种遗传性复杂、多基因相关的疾病,对其相关基因的研究一直都是疾病基因研究的热点和前沿,也是遗传学领域的难题.随着目前各种组学数据(Omics Data)的产生,全基因组关联研究(GWAS)中和精神分裂症相关的单核苷酸多态位点(SNP)越来越多的公布于学界,整合这些大规模数据并利用生物信息学模型预测精神分裂症相关基因能为进一步翔实探究致病或相关基因提供基因库的富集和优选.本文首先运用已被证明预测表现优秀的随机森林模型(Random Forests)预测精神分裂症的相关基因,然后用全基因组关联研究得到的相关基因的SNP位点进行验证及进一步筛选候选基因.结果随机森林预测模型得到33个精神分裂症候选基因,其中10个基因具有58个SNP位点是精神分裂症GWAS中的显著性SNP位点,因而这10个基因为优选的精神分裂症候选基因,文献查询结果表明这10个优选相关基因与精神分裂症有密切联系.  相似文献   

2.
多数全基因组关联性研究(GWAS)采用不同的分型芯片,导致遗传变异位点的数目及选择准则不同。基因型填补可以依据已有的基因分型数据,对未分型的位点进行填补。在应用IMPUTE2软件对基因型和表型数据库(db Ga P)中胃癌GWAS数据进行全基因组填补,以详细介绍全基因组填补的原理和过程。以第九号染色体为例,使用1000 Genome Project模板介绍全基因组填补的过程,包括填补前的质量控制、Pre-phasing、填补过程、填补的质量评估及填补后的关联性分析。第九号染色体在填补前有21 033个位点;而在填补后有1 630 406个SNP;其中INFO0.3的SNP位点有817 494个;而填补质量较高(INFO0.5)的位点数目有584 755个。IMPUTE2软件可以快速准确的对未分型的基因型进行填补,从而可以将多个GWAS数据整合到相同的位点数和密度上,再进行联合分析可以提高检验的把握度以便发现新的遗传易感性位点。  相似文献   

3.
全基因组关联研究(GWAS)已经发现许多与复杂的人类特征以及疾病有关的遗传变异.由于伦理和隐私问题,个体水平的基因型和表现型数据往往不容易被获取.相比之下,GWAS汇总统计正变得广泛可用.由于整合分析结合了多个GWAS,可以大幅增加样本量,从而增加检测到遗传变异的统计功效.因而,许多GWAS整合分析的统计方法被提了出来.随着GWAS整合分析统计方法的增加,研究人员需要一些有用的指导为实际数据的分析应用选择合适的统计方法.该文评估了GWAS中一些现有的整合分析方法的性能,使用了全面的模拟研究来比较这些方法的效能,并指出了每种方法的优缺点.  相似文献   

4.
全基因组关联分析(GWAS)是挖掘作物重要性状遗传信息的主要手段。随着测序技术的快速发展,开发单核苷酸多态性(SNP)标记的成本大幅降低,以连锁不平衡(LD)为遗传基础的GWAS技术已被广泛用于研究作物的农艺、品质和抗性等复杂性状。近年来GWAS技术已成功运用到对大豆重要性状的遗传解析上,并取得了一系列的研究进展。在简要介绍GWAS技术的原理和实施方法的基础上,总结分析了近年来其在大豆重要农艺性状、品质性状和逆境抗性性状上的遗传学研究进展及应用前景。  相似文献   

5.
利用贝叶斯网络描述单核苷酸多态性(SNP)与疾病之间的关系,以SNP与疾病之间的贝叶斯评分作为评价SNP与疾病关联度的目标函数,在全基因数据中通过布谷鸟优化算法对SNP与疾病之间的关联进行启发式搜索来寻找致病SNP;通过布谷鸟算法寻找致病SNP可以在保留SNP与疾病相关信息的同时,又能在全基因组数据中高效准确地找出致病SNP。实验结果表明:与已有方法相比,本文基于布谷鸟优化算法的全基因组关联分析方法具有更好的检测SNP与疾病之间关联的能力。  相似文献   

6.
全基因组关联分析(GWAS)是研究基因和疾病的新的热门工具.通过对足够多的人进行仔细查看,研究者能够检测出一些遗传关联,尽管这些遗传关联影响微弱,但可以为更深入的理解指明出路.最近进入热点排行榜的是阿尔茨海默症,代表论文是#7和#8,不知道是不是巧合,排在这两篇文章之前的#6论文是一篇关于GWAS研究的综述.  相似文献   

7.
针对面向整个全基因组关联研究(genome-wide association studies,GWAS)未覆盖基因组区的数据集成问题,提出基于自训练的半监督机器学习实现的语意映射技术应用于该研究领域的方法.研究结果表明:该方法能有效实现对整个GWAS未覆盖基因组区的自动的语意映射,精度达到94.2%,召回率达到97.5%,能有效降低对人类专家的依赖程度,实现对整个GWAS未覆盖基因组区数据的快捷有效集成.  相似文献   

8.
前列腺癌(Prostate Cancer,PCa)是老年男性最常见的恶性肿瘤之一.全基因组关联研究(Genome wide Association Studies,GWAS)发现SNP(Single Nucleotide Polymorphism)位点rs1741708与前列腺癌高风险性相关.表观遗传学标志物和荧光素酶报告子研究证实含有该风险性位点的染色体区段是等位基因特异性的增强子元件.敲除风险性增强子会导致细胞迁移能力减弱.利用Capture-C揭示该增强子在全基因组范围内的互作基因座位,结合风险性增强子敲除后基因表达的改变,鉴定出一些该增强子的直接靶基因.初步的Rescue研究发现,在敲除细胞中过表达靶基因IKZF3后,细胞迁移能力得到部分恢复,提示IKZF3是含有SNP rs1741708的风险性增强子影响肿瘤恶性进展的下游靶基因之一.  相似文献   

9.
长链非编码RNA(lncRNA)在恶性肿瘤发生发展中发挥重要的作用,其中lncRNA HOTAIR已经被证实能够促进多重肿瘤的转移.前期研究通过全基因组关联研究(GWAS)发现,12号染色体长臂13区13带(12q13.13)的SNP位点rs55958994是前列腺癌独立风险因子,通过生物信息学分析发现含有该风险性SNP的染色体座位是一个潜在的增强子元件,在22Rv1细胞系中敲除该增强子座位发现肿瘤细胞的转移侵袭能力明显降低;采用Capture-C实验结合基因表达谱分析发现该增强子元件通过染色质长距离相互作用调节lncRNA HOTAIR的表达;进一步采用细胞分子生物学实验证实HOTAIR是该风险性增强子影响肿瘤进展的关键基因之一.  相似文献   

10.
纵览生物学热点论文排行榜的标题,似乎可以发现这样一种现象,到处都是"大规模(large-scale)"、"鉴定(identifies)"、"位点(loci)"和"易感性(susceptibility)"等字眼。也许会有些词形上的变异,如"analysis(分析)"和"analyses(分析的复数形式)"。"风险(risk)"一词有时存在,有时没有,但"关联(association)"总是存在。如果有计算工具,通过分析这些数据你会发现,高引用和全基因组关联研究(GWAS)  相似文献   

11.
最初,是对个体的基因组测序,即2001年发布的“完整的”序列,作为一条参考序列,可以用于序列变异的比较,尝试将突变与健康异常进行匹配.后来,有了基因组关联研究(GWAS),通过研究数以千计的个体寻找那些不太明确的遗传关联(见本刊2011年第2期).现在,有了为GWAS注入新动力的千人基因组计划,引导着基因组研究进入新时...  相似文献   

12.
围绕牡蛎全基因组测序、基因组结构分析、基因注释、重要功能基因发掘和SNP标记开发几个目标展开了研究。采用fosmid克隆混池和等级组装策略成功解决了牡蛎高杂合度带来的基因组拼接困难,得到的基因组Contig和Scaffold N50分别达到19.4 Kb和401 Kb,整体测序深度大于800倍覆盖度。为后续的研究奠定了基础。对牡蛎基因组结构特征进行了分析。其基因组杂合度达到2.3%,重复序列丰富。在全基因组水平筛查到SNP位点312万个,其中基因区的SNP分布少于非基因区。共注释得到基因28 000多个。通过38个发育时期的表达谱测序,筛选到具有不同生物学含义的功能基因集,发掘了大量与生长发育等相关的基因,并对一些基因进行了详细研究。对牡蛎母本效应基因进行了发掘。鉴定出1 307个在雌性性腺中特异高度表达的基因,526个雄性性腺中特异高度表达的基因,包括一些重要的父本效应基因,如K81等。对性别决定基因进行了分析,发现Sox9、SRY等基因在牡蛎雄性性腺中特异表达,可能是决定牡蛎雄性转变的重要调控基因。对重要的发育基因家族进行了详细梳理和进化分析,包括130多种Homeobox基因、20多种Fox基因、10多种Wnt基因等。此外,对一些重要的功能基因如表皮生长因子受体(EGFR)和固醇调节原件结合蛋白(SREBP)等还进行了原味杂交、蛋白重组表达等功能研究。在全基因组范围以及转录区筛选到大量的SNP标记,在一些群体中验证了超过1 500个具有多态性的SNP。并把HSP、类胰岛素多肽等基因的SNP与表型性状进行了关联分析研究,发现一些与生长性状具有显著相关性的SNP标记。由于冠轮动物超门基因组数据缺少,牡蛎基因组的测序为生物多样性和进化生物学研究提供了重要数据。为牡蛎高度适应潮间带环境的分子机制研究提供了重要基础。项目的完成对贝类发育、贝壳形成、海洋无脊椎动物浮游幼虫的进化等机制有了更深入的理解。研究成果丰富了海洋基因资源,开发了大量分子标记,为分子育种的开展提供了条件。  相似文献   

13.
目前针对单独某一类型的组学数据,已挖掘出部分与肿瘤真实相关的遗传因素及环境因素等信息,但仍然可能仅是隐藏于复杂遗传机制背后的冰山一角,导致这种局限性的关键原因可能是疾病模型过于简化即忽略多层次组学数据之间的相互关系。研究认为在加深理解全基因组SNP数据的基础上,进一步融合多源组学数据,加深理解上位性、异质性等现象,从而提高肿瘤风险评估能力,有利于实现个体化医疗目标。本文从SNP数据和多源组学数据分析的角度比较分析现有复杂疾病的组学数据挖掘方法。  相似文献   

14.
指出了常见复杂疾病正在全球范围内流行,严重的危害着人类的健康.人们寄希望于利用全基因组关联研究来寻找复杂疾病的易感变异,同时发掘其背后隐藏的生物学机制.随着高速而又经济的高通量技术大量的涌现和不断的成熟,随着大规模数据管理和分析方法的逐步发展和完善,过去的4年中全基因组关联研究经历了一波高速发展的浪潮.对复杂疾病全基因组关联研究国内外进展进行了介绍,特别对两个有代表性的疾病全基因组关联研究进行了具体案例分析和评论,介绍了主要的数据分析方法,对全基因组关联研究中几个核心的问题进行了探讨.最后,对全基因组关联研究的未来进行了展望.  相似文献   

15.
为了寻找与瘦体重(lean body mass,LBM)相关的单核苷酸多态性(single nucleotide polymorphism, SNP)位点及易感基因,在1 000个不相关的白人中采用Affymetix 500K芯片扫描了500 000个SNPs,并进行全基因组关联分析(genome-wide association study,GWAS),显著结果在1 625个中国人样本和2 283个欧洲白人样本中进行验证,并将验证结果与研究结果进行荟萃分析。研究发现SNPsrs7905603,rs9416083,rs4409772,rs2894310与LBM关联,其中rs7905603位于基因ANXA8,其他3个SNPs位于基因C10orf11。荟萃分析得到的合并p值分别为2.08×10-5,7.44×10~(-6),6.73×10~(-6),6.76×10~(-6)。ANXA8和C10orf11基因是影响LBM变异的候选基因,这对肌少症的认识提供了新的理论依据。  相似文献   

16.
【目的】生长和木材基本密度是桉树的重要经济性状,挖掘其候选功能基因可为桉树遗传改良提供参考。【方法】以尾叶桉(Eucalyptus urophylla)和细叶桉(Eucalyptus tereticornis) F1全同胞子代试验林为研究对象,测定其8年生树高、胸径和木材基本密度,开展表型遗传分析。筛选极端表型个体,利用测序分型(GBS)开发SNP标记进行关联分析。挖掘与树高、胸径和木材基本密度关联的SNP位点,并进行候选基因初步定位。【结果】尾细桉F1子代树高、胸径与木材基本密度间的表型变异系数为7.51%~26.19%,生长性状与木材基本密度显著正相关。利用GBS获得了覆盖全基因组的15 185个SNP位点,关联分析共鉴定111个与生长和木材基本密度显著关联的SNP,其中2号染色体上检测到强烈的生长性状关联信号。定位40个与生长和木材基本密度相关候选基因,共富集在52个GO terms,基因功能注释分析表明其功能主要与植物抗逆性、生物与非生物胁迫、转录因子家族等相关。【结论】本研究获得了一批与尾细桉生长和材性性状关联的SNP位点和候选基因,并进行了树高、胸径及木材基本密度候选基因初步定位,挖掘的与抗逆性相关的基因可能在树木的生长和木材形成中发挥重要作用。  相似文献   

17.
一些基因变异已被发现与阿尔茨海默病典型表型脑脊液相关,但这些发现忽略了小效应风险的变体、基因座内部关联以及与外部环境之间的相互关系.为此,作者利用基于功能网络和基于通路信息的方法从系统生物学角度对遗传变异进行识别.将反映阿尔茨海默症早期病理特点的CSF t-tau作为表型,在全基因组关联分析的基础上提出一种基于权重调整的PageRank网络功能模块挖掘策略.该策略不仅挖掘到广泛研究的与t-tau相关的遗传变异,挖掘到的子网也富集在如神经退行性疾病,神经系统和信号转导等通路中,表明在系统生物学层面,策略识别的特征优先子网与表型具有一定的功能关联.  相似文献   

18.
疾病表型通常会受SNP位点调控,挖掘疾病表型与SNP位点间的关联规则有助于提供个性化分子诊疗方案。由于SNP位点具有遗传异质性,在挖掘疾病表型与SNP位点间的关联规则时,需要将最小支持度阈值设为较低值,甚至是0,又由于SNP位点数据量庞大,这会使得关联规则算法时间复杂度极高。为此,提出了HEMAPS算法,通过使用线程并行处理和垂直数据格式改进Apriori算法。此外,为解决质量性状表型样本比例不平衡问题,提出了一种新的关联规则评价指标——匹配度。实验结果表明,HEMAPS算法的时间复杂度比Apriori算法明显降低。  相似文献   

19.
为了寻找与瘦体重相关的单核苷酸多态性(SNP)位点及易感基因,在2 283名不相关的美国高加索人群中对瘦体重指数(LMI)进行全基因组关联分析(GWAS),并在1 000名不相关的美国高加索人群中验证,将研究结果与验证结果进行荟萃分析。研究发现,位于19p13.3区域的UQCR, MBD3和TCF3基因与LMI相关联。UQCR基因上rs8697(合并p=4.94×10~(-3))和rs56122285(合并p=2.59×10~(-3))具有eQTL效应,MBD3基因上rs8110543(合并p=6.88×10~(-3))和rs7252741(合并p=1.22×10~(-2))具有eQTL效应,DB得分分别为1b和1f。本研究进一步证实了UQCR,MBD3和TCF3基因在瘦体重变异中的作用,对肌少症的认识提供新的理论依据。  相似文献   

20.
外显子组测序主要包括3个步骤:目标序列的富集、DNA测序、生物信息学分析。笔者介绍了外显子组测序技术及其在遗传研究中的应用,分析了该技术的优势和不足,并对其应用前景进行了展望。与转录组和全基因组测序技术相比,外显子组测序在编码基因获取方面具有高效、准确、低成本的特点; 与全基因组关联分析技术(Genome-wide association analysis, GWAS)相比,能有效检测基因组中编码基因的稀有变异,但还不能检测到基因组水平上较大的结构性变异以及内含子区域的信息。目前,外显子组测序技术在人类单基因控制的遗传疾病和多基因控制的复杂疾病的分子机理研究中,能准确找到孟德尔遗传疾病致病基因; 在动植物上能成功检测到目标编码区的核苷酸变化。随着模式木本植物全基因组测序的完成,利用该技术可以加快对木本植物性别、林木抗逆性及生长等重要性状基因的定位,应用前景广阔。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号