首页 | 本学科首页   官方微博 | 高级检索  
检索     
共有20条相似文献,以下是第1-20项 搜索用时 906 毫秒

1.  基因组预测中先验分布的两种超参数设定策略比较  
   董林松  方铭  王志勇《厦门大学学报(自然科学版)》,2018年第4期
   基因组选择是通过全基因组的标记信息估计出个体的基因组育种值并加以选择的育种方法.主要围绕最佳线性无偏预测(BLUP)和贝叶斯方法展开.这些方法均在某种先验假设下进行,因此需要对先验分布的参数进行设定.依据设定先验超参数的原理,探讨了对单核苷酸多态性(SNP)基因型进行与不进行标准化两种策略下先验超参数的设定方法,并利用QTLMAS2012的模拟数据,分别计算了7种预测方法(岭回归BLUP(RRBLUP)、BayesA、BayesB、BayesCπ、快速BayesB(FBayesB),快速混合正态分布(FMixP)和基于马尔科夫链-蒙特卡洛算法的MixP(简称MMixP))在2种策略下的基因组育种值.结果显示:当采用同一种预测方法,对SNP基因型进行标准化处理与否不影响基因组育种值估计结果.但由于对基因型进行标准化处理在方法上更具有通用性,并可以突出效应大的SNP位点,故建议进行SNP效应值估计前,先将SNP基因型标准化,再设定先验分布的参数值.    

2.  从SNP到标签SNP的算法实现与讨论  
   裴志利  梁艳春  卢奕南  曹忠波  孔英《内蒙古民族大学学报(自然科学版)》,2006年第21卷第6期
   由于对全部的SNP位点都进行基因分型的成本过于昂贵,而少量的标签SNP就能够提供与全部1500万个SNP位点大致相同的图谱信息.因此,如何选择标签SNP就显得十分重要,本文中所实现的选择标签SNP的算法是以连锁不平衡(Linkage Disequilibrium,LD)为基础的.    

3.  基于RAD-seq技术的鹅掌楸基因组SNP标记开发  
   陆叶  龙晓飞  王鹏凯  陈金慧  施季森《南京林业大学学报(自然科学版)》,2019年第4期
   【目的】开发大量可靠的SNP标记,为鹅掌楸高密度遗传连锁图谱的构建和基于基因组的林木选择育种提供分子基础。【方法】从北美鹅掌楸NK基因型为母本、鹅掌楸LS基因型为父本的F1代杂交群体中,选取198株个体为作图群体。用限制性内切酶EcoR I对包括2个亲本和198个子代在内的200个单株的基因组DNA进行酶切,构建RAD(restriction-site associated DNA)文库并进行RAD-seq测序。采用读长为91 bp的双末端测序。2个亲本的平均测序深度为2×,198个子代的平均测序深度为0.8×,平均产量为1.94 Gb,共获得约387.21 Gb数据。用Stacks软件将每个样品的RAD-reads作生物信息学分析,对候选位点进行卡方检验和缺失率检验,再将符合孟德尔遗传的标记及与之相对应的RAD-tag序列和鹅掌楸参考基因组序列进行比对。最后,从本研究开发的SNP标记中选取27个候选SNP位点,设计引物,对随机挑选的16个F1代进行PCR扩增并将结果进行测序,同时验证SNP的有效性。【结果】从候选群体中共鉴定到22 019个SNP位点,符合孟德尔遗传规律的标记为4 233个,最终获得3 501个候选SNP标记。SNP验证中,共有293个SNP标记完成测序并能判读结果,所有位点都为SNP位点,共有194(66.2%)个SNP变异类型得到了验证。【结论】基于RAD-seq技术和鹅掌楸参考基因组序列为基础的策略,能够作为一种快速有效的手段,实现大规模的分子标记开发,可用于鹅掌楸等林木的高密度遗传图谱的构建。    

4.  藏族人群15号染色体中心粒区域基因的高精度连锁不平衡和单体型图谱及其与汉族人群的比较  
   黄玮俊  李彩霞  拉布  周雁  黎培兴  胡彬  普布卓玛  格桑卓嘎  方积乾  王一鸣《科学通报》,2006年第51卷第3期
   遗传多态性及其对基因功能的影响是目前基因组学研究的热点之一. 随着国际单体型图计 划(International HapMap Project)数据的公布和超高通量基因型鉴定平台的出现, 利用全基因组关联 分析法(genome-wide association approach)进行复杂性状/疾病的遗传变异的研究将很快成为现实. 尽 管这一方法的检测效能已得到广泛认同, 但是这一研究对揭示群体遗传差异程度的要求及怎样才能 最好的运用这些信息去进行研究仍为争论的热点. 为了探讨这个问题, 在50例藏族志愿者中对15号染色体中心粒区域的7个基因进行了测序, 鉴定了该区域中的单核苷酸多态性(SNP)、SNP频率、标签SNP(tagSNP)、连锁不平衡(LD)结构和单体型组成, 并将以上数据和汉族人群进行了比较. 同时还对藏汉两个群体的遗传差异进行了量化分析. 结果显示, 藏汉两个群体间这一区域在总体上无显著的遗传差异, 但某些等位基因频率存在显著的不同, 而等位基因频率是构建单体型和选择标签SNP的决定因素之一. 在总体上, 和汉族相比这一区域藏族人群连锁不平衡区域较长而遗传差异较小. 本研究结果为藏汉两群体间具有很近的亲缘关系提供了遗传学上的证据, 并支持所有群体从根本上是同等的观点, 同时也提示在复杂性状/疾病的研究中需要考虑群体间的差异, 特别是等位基因频率的差别. 本研究所获数据不仅有助于对藏族该区域基因组结构的理解, 而且还对以藏族同胞为研究对象的在这一基因组节段及其所含基因所进行的研究提供了有用的工具.    

5.  基于IMPUTE2的全基因组关联性研究的基因型填补  
   辛俊逸  葛雨秋  邵卫  杜牧龙  马高祥  储海燕  王美林  张正东《科学技术与工程》,2018年第18卷第15期
   多数全基因组关联性研究(GWAS)采用不同的分型芯片,导致遗传变异位点的数目及选择准则不同。基因型填补可以依据已有的基因分型数据,对未分型的位点进行填补。在应用IMPUTE2软件对基因型和表型数据库(db Ga P)中胃癌GWAS数据进行全基因组填补,以详细介绍全基因组填补的原理和过程。以第九号染色体为例,使用1000 Genome Project模板介绍全基因组填补的过程,包括填补前的质量控制、Pre-phasing、填补过程、填补的质量评估及填补后的关联性分析。第九号染色体在填补前有21 033个位点;而在填补后有1 630 406个SNP;其中INFO0.3的SNP位点有817 494个;而填补质量较高(INFO0.5)的位点数目有584 755个。IMPUTE2软件可以快速准确的对未分型的基因型进行填补,从而可以将多个GWAS数据整合到相同的位点数和密度上,再进行联合分析可以提高检验的把握度以便发现新的遗传易感性位点。    

6.  Calpain 10基因与新疆维吾尔族2型糖尿病遗传易感性研究  
   褚志华  张君  袁红玲  田世坤  徐文静  陆环  李爱琴  谢建新《石河子大学学报(自然科学版)》,2009年第27卷第3期
   研究Calpain 10基因单核苷酸多态性(SNP)43G-A和63C-T两个位点与新疆地区维吾尔族人群2型糖尿病(Type 2 diabetes mellitus,T2DM)之间的关系。采用1∶1病例——对照研究方法,以聚合酶链式反应——限制性内切酶长度多态性(PCR-RFLP)技术,对120例T2DM患者和120例正常对照者Calpain 10基因SNP43、SNP63多态性位点进行基因分型。SNP43多态性位点的基因型和等位基因频率在病例组和正常对照组中的分布存在差异,T2DM组中GG基因型和等位基因频率均低于对照组,但是A等位基因频率高于对照组,差异有统计学意义(P〈0.005);SNP63多态性位点的基因型频率和等位基因频率在病例组和正常对照组中的分布无显著差异,(P〉0.005)。结果表明:(1)Calpain 10基因SNP43多态性位点与新疆地区维吾尔族人群T2DM有明显相关性;(2)SNP63多态性位点与新疆地区维吾尔族人群T2DM无明显相关性。    

7.  精神分裂症相关基因的预测——基于大规模数据的整合分析  
   梁燕  史艺宾  田卫东《复旦学报(自然科学版)》,2013年第52卷第2期
   精神分裂症(Schizophrenia)是一种遗传性复杂、多基因相关的疾病,对其相关基因的研究一直都是疾病基因研究的热点和前沿,也是遗传学领域的难题.随着目前各种组学数据(Omics Data)的产生,全基因组关联研究(GWAS)中和精神分裂症相关的单核苷酸多态位点(SNP)越来越多的公布于学界,整合这些大规模数据并利用生物信息学模型预测精神分裂症相关基因能为进一步翔实探究致病或相关基因提供基因库的富集和优选.本文首先运用已被证明预测表现优秀的随机森林模型(Random Forests)预测精神分裂症的相关基因,然后用全基因组关联研究得到的相关基因的SNP位点进行验证及进一步筛选候选基因.结果随机森林预测模型得到33个精神分裂症候选基因,其中10个基因具有58个SNP位点是精神分裂症GWAS中的显著性SNP位点,因而这10个基因为优选的精神分裂症候选基因,文献查询结果表明这10个优选相关基因与精神分裂症有密切联系.    

8.  复合性状的QTL定位模型构建  
   王静  朱嵊  李佳慧  张丽  张萌  姜立波  黄敏仁  邬荣领《南京林业大学学报(自然科学版)》,2018年第4期
   【目的】传统复合性状的QTL(quantitative trait locus)定位方法仅仅利用两个或几个构成性状的计算值作为表型值,未考虑复合性状的生物学内涵,从而影响定位的准确性。因此,发展适合于复合性状的QTL定位模型,对于深入解析控制复合性状的遗传结构,进而提高基因定位准确性显得越来越重要。【方法】针对全基因组重测序数据,构建了一个复合性状QTL定位模型(composite traits mapping model,CTM),利用CTM对复合性状进行分解,把分解后的组分以二元或多元正态分布形式整合到QTL作图的框架内。【结果】应用CTM分析杨树材积生长数据,可成功定位到大量与杨树材积生长相关的基因,并与传统方法进行了比较,定位出较多的显著位点,表现出较好的性能。计算机模拟试验表明,所构建的CTM模型在定位复合性状QTL中具有较高的效力,在达到一定的样本数量和遗传力条件下,CTM模型具有较强的效力,样本量和遗传力的增加都能够增加参数估计的精度。【结论】CTM模型有助于复合性状遗传结构的解析,促进林木分子标记辅助育种的开展。    

9.  新疆维吾尔族人TNFβ-804基因多态性与乙型肝炎易感性的相关性研究  
   王英姿  姚建勇  赵义梅《科技信息》,2009年第18期
   目的:研究TNF-β基因单核苷酸多态性(SNP)804位点与新疆地区维吾尔族人乙型肝炎之间的关系。方法:用套式PCR(nested PCR)和等位基因特异性PCR(allele一speciicfic PCR,AS-PCR)法,对120例乙肝患者和120例正常对照者TNF-β基因SNP804多态性位点进行基因分型。结果:SNP804多态性位点C/C基因型和C/A+AA基因型频率在病例组为77%和23%,正常对照组为88%和12%,两组间基因型和等位基因频率分布差异有显著性(p<0.05)。结论:TNF-β804多态性位点与新疆维吾尔族人乙肝有明显相关性。    

10.  新疆维吾尔族人TNFβ-804基因多态性与乙型肝炎易感性的相关性研究  被引次数:1
   李沛文《科技信息》,2009年第18期
   目的:研究TNF-β基因单核苷酸多态性(SNP)804位点与新疆地区维吾尔族人乙型肝炎之间的关系。方法:用套式PCR(nested PCR)和等位基因特异性PCR(allele一speciicfic PCR,AS-PCR)法,对120例乙肝患者和120例正常对照者TNF-β基因SNP804多态性位点进行基因分型。结果:SNP804多态性位点C/C基因型和C/A+AA基因型频率在病例组为77%和23%,正常对照组为88%和12%,两组间基因型和等位基因频率分布差异有显著性(p〈0.05)。结论:TNF-β804多态性位点与新疆维吾尔族人乙肝有明显相关性。    

11.  载脂蛋白E和SHCP66的基因单核苷酸多态性及其与长寿性状的相关研究  
   陈华  盛小华  陈琨  陈空  蔡尚荣  黄薇  金建中  卢大儒  金力《复旦学报(自然科学版)》,2002年第41卷第1期
   研究载脂蛋白E(Apolipoprotein E,APOE)和SHCP66(Src homology-domain cotaining protein,66ku)的基因在一个中国隔离人群中的单核苷酸多态性(single nucleotide polymorphism,SNP),以及它们与长寿性状的相关性,应用多聚酶链式反应结合测序技术对2个基因的外显子区域进行小样本(40个随机个体)的单碱基多态位点(SNP)检测,并对其中apoe的2个侯选位点在大样本中进行基因分型,结果在apoe基因中发现3个SNP位点,其中一个在调控区内的位点是首次报道,shcp66发现3个SNP位点和一个缺失突变,均为首次报告.apoe的2个候选位点在隔离人群中的长寿个体及对照组中基因频率的卡方测验显示无显著差别(P>5%),因此,在该长寿人群中,该基因的多态现象与长寿性状无显著的关联。    

12.  基于K-S检验和邻域粗糙集的特征选择方法  
   刘艳  程璐  孙林《河南师范大学学报(自然科学版)》,2019年第2期
   传统的肿瘤基因选择算法挑选出的特征基因中存在大量噪声基因和冗余基因,从而对基因算法的准确性和分类精度产生影响.针对这一问题,将K-S检验与邻域粗糙集融合成为一种新的特征选择方法.首先,采用累积分布函数计算正负类样本的累积函数值和K-S检验统计量,对照显著性水平下的样本统计量,从而去除冗余基因和噪声基因;然后,使用邻域粗糙集进行约简,对比条件属性重要度得出最优约简结果;最后,对比K-S检验和两种基于K-S检验的特征选择方法得到的冗余度和分类精度,通过实验验证这种方法不仅能准确挑选出具有显著区分能力的肿瘤基因,且效率高具有可行性.    

13.  基于广义线性模型的基因表达水平预测  
   师豪杰  顾宏  徐晓璐  秦攀《大连理工大学学报》,2020年第60卷第1期
   组蛋白修饰是生物体中普遍存在的一种现象,能够以不同的调控方式影响基因表达,且随着高通量测序技术的飞速发展,大量的测序数据使得探究组蛋白修饰信号与基因表达水平之间的内在联系成为可能.由于基因表达数据存在零膨胀现象,提出了一种基于广义线性模型框架的主从模型,能够以较高精度从组蛋白修饰信号预测基因表达水平.首先通过人类全基因组注释文件中的基因位点信息,筛选出包含完整基因位点信息的表达数据;其次,根据基因位点信息,定位并提取出组蛋白修饰数据中基因特定位点的特征信息,构建设计矩阵;最后结合响应变量数据零膨胀的特点,构建主从模型,以GM12878细胞系为例,与现有的多种回归算法进行对比,验证了所提模型的有效性.    

14.  基于SLAF-seq技术的抗杨树叶锈病SNP位点开发  
   戴美丽  方乐成  尹佟明  李小平《南京林业大学学报(自然科学版)》,2019年第2期
   【目的】探索美洲黑杨抗叶锈病的分子机制,为杨树抗病分子育种提供理论参考。【方法】选取抗锈病差异显著的美洲黑杨‘2-2’与‘2-38’为亲本,通过控制授粉杂交获得80个F1代个体。用特异性位点扩增(specific-locus amplified fragmenl sequencinq, SLAF-seq)简化基因组技术对所获F1代进行深度测序,以美洲黑杨第3代组装基因组为参照。通过序列比对筛选特异长度的DNA片段,构建SLAF-seq文库,获得特异性SNP位点。经美洲黑杨叶锈病的病原菌经形态学与分子工具鉴定,确定为落叶松-杨栅锈菌(Melampsora larici-populina Kleb.)。通过叶盘法控制条件接种并对被锈菌侵染后的杨树抗性进行评估;应用Kruskal-Wallis方法对接种结果进行检验。【结果】通过接种,获得了孢子堆数量和大小等表型数据;基于SNP标记的连锁分析,一共有8 723个SNP连锁至遗传图谱上;共识别出19个连锁群,总遗传距离为3 610.67 cM;通过Kruskal-Wallis检验可得到37个紧密连锁位点(P0.005),标记分别位于I、IV、VI、XI、XV和XIX号连锁群上。【结论】利用SLAF-seq技术开发出了37个与杨树叶锈病抗病性状紧密关联的SNP分子标记,其中Marker42056位点连锁程度最高。    

15.  基于组稀疏的遗传性疾病和性状基因位点选择方法研究  
   张跻  杨勃《湖南理工学院学报》,2018年第1期
   如何从海量基因信息中高效挖掘出遗传性疾病密切相关的基因位点是全基因组关联性分析的核心问题.然而,目前常用的致病基因位点选择单变量分析技术不能发现多基因复杂交互形成的致病机制.为此,本文尝试从多变量分析角度,采用稀疏优化模型,实现致病基因的选择.为进一步实现致病基因位点的选择,采用基于L12范数的最小组稀疏角回归算法,通过调整正则化系数大小来控制模型的组间稀疏度,最终有效实现了致病基因和基因位点的选择.最后,通过某遗传疾病的真实基因数据,验证了该方法的有效性.    

16.  全基因组关联研究中的遗传位点分析方法  
   卜庆伟  杨雨诗  葛方丽  陈雄《科学技术与工程》,2017年第17卷第17期
   本文提出多种模型方法,对高维位点数据进行分析,为基因定位和复杂疾病性状遗传等方面的研究提供新的技术支持。为了实现关联位点在基因中的定位,首先建立映射模型,对每个位点的碱基对重新编码;然后,提出将质量控制模型与关联分析模型相结合的方法,确定位点的关联程度,随后利用基于随机森林的重要性排序,筛选与该遗传疾病最相关的致病位点;最后,设计出高维RBF神经网络,得到每个位点对性状的相关性系数,探索出与疾病多类性状相关的位点。结合多种检验方式,验证所建模型能够较为准确地定位与疾病相关的位点及基因。各类模型具有极强的推广性,广泛适用于筛选占有各自权值的大样本数据。    

17.  中国正常人群中先天性代谢疾病相关基因的DNA变异位点分布频率的研究  
   韦雨琦  孙一丹  王艳菁  刘逸晨  周伟  沈陆  周晨希  贺林  怀聪  秦胜营《湖南师范大学自然科学学报》,2019年第4期
   为从整体层面研究我国正常人群先天性代谢缺陷DNA变异位点分布及频率,在88例中国正常人基因组DNA样本中,使用Haloplex序列捕获技术结合Illumina Miseq二代测序平台对10种先天性代谢缺陷的78个候选致病基因进行统一靶向测序,利用SureCall软件分析测序数据及质控;并用SIFT和Polyphen软件以及dbSNP数据库进行突变位点分析和功能预测;用SHEsis在线软件分析SNP/SNV的等位基因频率;此外用PyMOL对两个文献中尚未报道的位点进行蛋白结构功能分析。本实验共检出514个DNA变异位点,其中99个为错义变异。在这99个错义变异中,有2个是已报道的先天性代谢缺陷致病位点,且该位点在本研究人群中的分布频率高于亚洲数据库频率。本研究为中国人群先天性代谢缺陷的基因筛查提供了一定的理论依据。    

18.  面向客户偏好异质性的车身产品离散选择模型  
   徐凯翔  刘海江  潘振华《同济大学学报(自然科学版)》,2018年第46卷第5期
   基于随机系数mixed logit模型,针对车身产品层次结构,建立面向客户偏好异质性的离散选择模型.根据SP(stated preference)调查所获样本数据和参数先验分布设定,运用马尔可夫链蒙特卡洛模拟方法,对参数进行贝叶斯估计.最后,通过McFadden的似然比指标检验,证明随机系数mixed logit模型具有更好的拟合优度,更能阐明客户偏好异质性的所在.该建模方法不仅有助于捕获个性化客户需求,还有助于厂商预测潜在客户的多种偏好,从而辅助车身产品的设计开发.    

19.  封闭群长爪沙鼠遗传标准的建立  被引次数:1
   李薇  江其辉  杜小燕  尚世臣  陈振文《实验动物科学》,2011年第28卷第2期
   目的 建立封闭群长爪沙鼠遗传质量标准和遗传质量检测方法。方法根据群体遗传学理论,参照实验动物哺乳类实验动物的遗传质量控制(GBl4923—2001),在查阅大量文献资料的基础上,建立封闭群长爪沙鼠遗传标准。检测方法采用微卫星标记分析技术。从GeneBank中挑选出的536个小鼠微卫星位点对长爪沙鼠基因组DNA进行PCR扩增得到135个长爪沙鼠微卫星,并优化PCR扩增条件,通过琼脂糖电泳和STR扫描二级筛选,根据位点在染色体分布情况、等位基因数目和多态性等优化出适于封闭群长爪沙鼠遗传检测的微卫星位点组合,建立检测方法。结果初步建立了封闭群长爪沙鼠遗传质量标准和检测方法。    

20.  加权极限学习机的多变量时间序列预测方法  
   叶秋生  陈晓云《福州大学学报(自然科学版)》,2016年第44卷第3期
   提出一种基于样本分布的极限学习机预测模型WELMSD,该模型先用kN近邻密度估计方法估计出样本的密度值,再用估计出的密度值给传统ELM的经验风险项加权,克服传统ELM在对时间序列进行预测时忽略样本分布的缺点。基于Rossler沌时间序列和上证、深证股票数据的实验仿真结果证明了所提算法的有效性,且当近邻参数kN取值较小时,所提模型对参数不敏感,是一种更优的多变量时间序列预测模型。    

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号