首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 796 毫秒
1.
全基因组关联分析(GWAS),是通过考察全基因组范围DNA变异的单核苷酸多态性(SNP),挖掘影响复杂疾病等的表型性状(如疾病、癌症、身高等)的SNP的计算方法,以期为疾病/表型的分子生物发现、生物机理分析、分子靶向药物研究、疾病早期风险预测和个性化治疗等提供科学依据.目前的方法多以统计学、机器学习和深度学习、智能优化等等及其它们的组合为基础,并已取得可喜成绩,但仍有许多无法复现的关联的例子,正如Ioannidis 2005年在国际知名刊物PLoS Medicine上发表、至今已被引用6 600多次的论文中所说"大部分的研究发现是错的".文章认为,这是因为其核心问题仍未解决,尤其是到底要从数据中挖掘出什么和统计重要性在什么情况下具有科学重要性,以及科学重要性是否可以科学定义等,这些都是GWAS对数据科学的严峻挑战.  相似文献   

2.
多数全基因组关联性研究(GWAS)采用不同的分型芯片,导致遗传变异位点的数目及选择准则不同。基因型填补可以依据已有的基因分型数据,对未分型的位点进行填补。在应用IMPUTE2软件对基因型和表型数据库(db Ga P)中胃癌GWAS数据进行全基因组填补,以详细介绍全基因组填补的原理和过程。以第九号染色体为例,使用1000 Genome Project模板介绍全基因组填补的过程,包括填补前的质量控制、Pre-phasing、填补过程、填补的质量评估及填补后的关联性分析。第九号染色体在填补前有21 033个位点;而在填补后有1 630 406个SNP;其中INFO0.3的SNP位点有817 494个;而填补质量较高(INFO0.5)的位点数目有584 755个。IMPUTE2软件可以快速准确的对未分型的基因型进行填补,从而可以将多个GWAS数据整合到相同的位点数和密度上,再进行联合分析可以提高检验的把握度以便发现新的遗传易感性位点。  相似文献   

3.
为了满足探测范围的要求,多模式探测在风廓线仪中被普遍采用,交叉高度风速值的选取对最后的风廓线质量至关重要.现有的选取高一层数据的整合方案效果不甚理想,对多模式探测时交叉高度层数据的差异性进行了统计,分析了存在差异性的原因.在此基础上,提出了以雷达自身数据为依据,利用统计方法确定垂直一致性检测门限值来选取交叉高度层数据的多模式探测数据整合方案.通过大量实测数据验证,该方案数据整合效果明显高于传统方法.  相似文献   

4.
针对面向整个全基因组关联研究(genome-wide association studies,GWAS)未覆盖基因组区的数据集成问题,提出基于自训练的半监督机器学习实现的语意映射技术应用于该研究领域的方法.研究结果表明:该方法能有效实现对整个GWAS未覆盖基因组区的自动的语意映射,精度达到94.2%,召回率达到97.5%,能有效降低对人类专家的依赖程度,实现对整个GWAS未覆盖基因组区数据的快捷有效集成.  相似文献   

5.
全基因组关联分析(GWAS)是挖掘作物重要性状遗传信息的主要手段。随着测序技术的快速发展,开发单核苷酸多态性(SNP)标记的成本大幅降低,以连锁不平衡(LD)为遗传基础的GWAS技术已被广泛用于研究作物的农艺、品质和抗性等复杂性状。近年来GWAS技术已成功运用到对大豆重要性状的遗传解析上,并取得了一系列的研究进展。在简要介绍GWAS技术的原理和实施方法的基础上,总结分析了近年来其在大豆重要农艺性状、品质性状和逆境抗性性状上的遗传学研究进展及应用前景。  相似文献   

6.
精神分裂症(Schizophrenia)是一种遗传性复杂、多基因相关的疾病,对其相关基因的研究一直都是疾病基因研究的热点和前沿,也是遗传学领域的难题.随着目前各种组学数据(Omics Data)的产生,全基因组关联研究(GWAS)中和精神分裂症相关的单核苷酸多态位点(SNP)越来越多的公布于学界,整合这些大规模数据并利用生物信息学模型预测精神分裂症相关基因能为进一步翔实探究致病或相关基因提供基因库的富集和优选.本文首先运用已被证明预测表现优秀的随机森林模型(Random Forests)预测精神分裂症的相关基因,然后用全基因组关联研究得到的相关基因的SNP位点进行验证及进一步筛选候选基因.结果随机森林预测模型得到33个精神分裂症候选基因,其中10个基因具有58个SNP位点是精神分裂症GWAS中的显著性SNP位点,因而这10个基因为优选的精神分裂症候选基因,文献查询结果表明这10个优选相关基因与精神分裂症有密切联系.  相似文献   

7.
用一种新的转录因子介导的信号通路分析方法分析肿瘤芯片数据,从中推断异常的转录因子和信号通路.先通过统计目标基因的表达推断转录因子的活性,然后将那些活性异常的转录因子映射到KEGG信号通路上.此方法整合了基因表达调控的实验数据和信号通路信息.利用此方法,对斯坦福芯片数据库中的162个人类胃癌数据进行分析,结果发现,大部分芯片中的TGF-beta,JAK-STAT,NF-kappaB和Notch信号通路被异常激活.进一步对这些通路进行研究,将有助于探究胃癌的发生、发展机理和进行合理的药物设计.  相似文献   

8.
全基因组关联分析(GWAS)是研究基因和疾病的新的热门工具.通过对足够多的人进行仔细查看,研究者能够检测出一些遗传关联,尽管这些遗传关联影响微弱,但可以为更深入的理解指明出路.最近进入热点排行榜的是阿尔茨海默症,代表论文是#7和#8,不知道是不是巧合,排在这两篇文章之前的#6论文是一篇关于GWAS研究的综述.  相似文献   

9.
介绍了多元统计方法的分析思想及其研究样本变量的选取,并利用我国一些上市公司的财务年报中的信息和数据,建立了多变量的预测模型对企业的财务预警进行分析.结果显示:通过财务预警分析数据,企生可以发现一些潜在的财务危机,井通过相关政策予以避免.  相似文献   

10.
许多高校的管理信息系统较齐全,但各应用系统相互独立,数据来源不一致,数据不能共享,不能充分发挥已有系统的作用.因此,整合校园管理信息系统,建立学校资源中心和数据交互平台,是当前高校亟待解决的问题.在云计算兴起的时代,构建基于云计算的资源共享平台,有利于提高校园信息化水平,推动教学改革.本文对传统的高校信息管理弊端进行了分析,并且对高校云计算资源共享平台的建设及其相关的一些技术进行了研究.  相似文献   

11.
随着大学英语教学改革步伐的加快,多媒体在大学英语教学中被广泛应用,其优势是传统教学手段无法比拟的.但由于多媒体教学在国内发展还不成熟,许多教师对其存在认识上的误区.本文客观阐述了大学英语教学中对多媒体存在的一些倾向性误区及如何使多媒体技术更好地整合到大学英语教学中,提出一些个人观点和建议.  相似文献   

12.
组变量出现在许多统计建模问题中,如回归模型中的多水平分类变量可以由一组哑变量表示.Group MCP和Group SCAD因具有Oracle性质被广泛使用.该文将这两种方法应用于广义线性模型,分别在Logistic回归模型和Poisson回归模型中研究了基于Group SCAD和Group MCP的组变量选择.通过数据模拟和实际数据分析,验证了这两种方法具有非常好的表现.  相似文献   

13.
一些基因变异已被发现与阿尔茨海默病典型表型脑脊液相关,但这些发现忽略了小效应风险的变体、基因座内部关联以及与外部环境之间的相互关系.为此,作者利用基于功能网络和基于通路信息的方法从系统生物学角度对遗传变异进行识别.将反映阿尔茨海默症早期病理特点的CSF t-tau作为表型,在全基因组关联分析的基础上提出一种基于权重调整的PageRank网络功能模块挖掘策略.该策略不仅挖掘到广泛研究的与t-tau相关的遗传变异,挖掘到的子网也富集在如神经退行性疾病,神经系统和信号转导等通路中,表明在系统生物学层面,策略识别的特征优先子网与表型具有一定的功能关联.  相似文献   

14.
国外旅游问卷调查及数据分析的有关问题   总被引:3,自引:0,他引:3  
定量方法是国外旅游研究的主导方法,国内研究者由于缺乏统计知识的训练而较少使用定量方法,但定量研究是更接近于科学的研究方法,相对于定性方法的主观性,定量研究是一种客观的、系统的、精确的研究方法.本文对旅游研究中最常用的数据收集方法--问卷调查法,和最常使用的数据分析方法--T检验、ANOVA、卡方检验、因子分析进行了初步分析.问卷调查主要分析问卷设计的程序、问卷结构和量表的设计、取样框架、取样方法和样本规模等问题,数据分析方法主要分析各统计方法的基本思想和使用范围.  相似文献   

15.
近年来,由于高校对信息化技术应用的重视,校内使用的业务系统逐渐增多,数据信息不断扩大,为提高工作效率,避免"信息孤岛"的产生,学校对各应用系统中的数据实现整合的需求,也越来越迫切.本文介绍了高校数据整合应用系统在设计中主要的研究内容和技术特点.分析了NOVELL Identity Manager 3关键技术,并根据实际工作经验,对系统的架构作出了比较详细的说明.  相似文献   

16.
主成分分析是数据压缩和特征提取的非常有效的统计方法.在经典的主成分分析中,每个训练数据在构建主成分时的作用是相同的.然而,在许多实际问题中,每个训练数据的意义和作用是不同的,对于重要的数据我们应给予充分的重视,而对于不可信数据(可能是异常数据)应限制其作用.文中给每个训练数据赋予一个置信权重,将训练数据视为样本空间的模糊点,研究了基于模糊点数据的主成分分析.数值实验表明,该方法能够有效控制异常点对主成分的影响,同时,该方法也为数据先验信息的利用提供了一个可行的途径.  相似文献   

17.
在新课程改革的背景下,小学自然课程被科学课程所取代,这种取代并不是形式上的变化,而是课程整合的结果.课程整合后,科学课程的教学取得了可喜的成果,但由于各方面的原因,目前在学习兴趣培养、教学方法改革等方面也存在一些问题.为了促进小学科学课程教学质量的提高,必须从优化教学环境、提升教师能力等3个方面对这些问题进行认真的分析和研究.  相似文献   

18.
教育信息化进程发展到今天,已经有不计其数的应用系统在校园网上被建立.由于各种原因系统间的数据不能共享形成信息孤岛.为了进一步提高信息化程度,各种整合技术应运而生.本文提出了一种基于Web Services的新系统整合模型,把待整合的各种应用系统看成用XML描述的资源,通过XML传递参数而不是传递处理数据.这样在避免对底层数据额外处理(如统一数据格式)的情况下进行了高校应用系统的整合.屏蔽了复杂过程,提高了各应用系统协同工作的效率.  相似文献   

19.
在许多机器学习问题中,往往需要研究高维数据中各个特征之间的统计相关性.稀疏高斯图模型作为解决这一问题的有效方法之一,广泛应用于数据挖掘、生物信息、金融分析等应用问题中.由于模型参数量是数据维度的平方量级,基于高维数据的稀疏高斯图模型的参数估计一直是统计机器学习研究中的挑战性问题之一.提出了一种新颖的基于坐标下降优化的稀疏高斯图模型并行估计算法,其核心思想是根据高斯图模型结构估计等价于每个变量的稀疏近邻选择这一基本结论,采用坐标下降来求解每个近邻选择子问题.通过将样本矩阵进行分布式存储,在MPI(Message-Passing Interface)框架下实现了这些子问题的并行求解.实验结果表明,该算法具有良好的并行运算性能,在保证结构估计精度的同时,能够大幅度提升运算速度.  相似文献   

20.
在教育对比实验中,由于受测量工具的限制,学习结果的测评数据往往难以视为等距,所以对获得的等级数据,相应的统计方法也应随之改变.研究了教育对比实验中等级数据的统计检验方法,内容包括等级数据离散程度的熵估计、二维列联表两属性间独立性的χ2检验、相合系数的估值和相合系数的显著性检验.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号