首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
全基因组测序技术研究及其在木本植物中的应用   总被引:2,自引:0,他引:2  
基因组序列是开展遗传研究重要的信息基础,随着测序技术飞速发展至第3代长片段测序方法,测序读长历经从几十到数万个碱基的提升,对进一步提升基因组组装的完整度以及准确性提供了极大的裨益。现已完成了大量植物种全基因组测序工作,其中木本植物有40多个,还有更多树种的全基因组测序正在进行之中。针对各类测序技术的基因组组装及后续分析,研究人员也开发了大量的生物信息学工具。笔者从测序技术、基因组装技术和全基因组测序生物信息学分析等方面,罗列了目前已完成全基因组测序的木本植物,介绍了全基因组测序技术的发展与应用,以及适用于第3代数据基因组组装的生物学分析软件,为林木基因组研究者提供一定的借鉴。  相似文献   

2.
在已有测序数据基础上,利用三种常见的序列组装软件对Paenibacillus Shenyangensis全基因组测序结果进行拼接组装,分析比较了不同软件在各自最优参数条件下DNA序列的组装数据,并与NCBI数据库中类芽孢杆菌属其他近缘种进行基因比对与预测.结果表明,SOAPdenovo的组装结果最优,在k-mer为23时,组装基因组总长和N50分别为5 501 467和293 864 bp,预测的4 800个基因中有4 393个与NCBI-Nr数据库比对并注释成功.  相似文献   

3.
单细胞转录组测序是一种在单细胞水平上测量基因表达的技术,已经广泛应用于生命科学研究领域.由于实验条件、技术平台、样本来源等因素的差异,单细胞转录组数据的批次效应会影响数据的可靠性和准确性.因此,批次效应校正是单细胞转录组数据分析的一个重要预处理步骤.提出了一种基于生成对抗网络的单细胞转录组测序数据批次效应校正算法scBCMGAN,结合自编码器和零膨胀负二项分布等对数据进行重构,在潜在层部分通过生成对抗网络使目标批次数据向源批次数据进行学习,达到校正批次效应的目标.实验结果表明该方法在真实数据集上具有显著优势,能够有效校正批次效应,且校正后数据适用于下游分析.  相似文献   

4.
本研究基于下一代测序技术,对黄连基因组进行了勘测,构建了两个插入片段大小分别为200bp和500bp的文库,进行了深度约30X的测序。通过测序获得了54Gb的原始数据,过滤后得到44.8G数据。通过SOAP de nove软件组装后初步获得了contig和Scaffold序列,进一步分析结果显示其基因组大小为1,116Mb左右,大约具有1.1%的杂合度,说明要完成该物种的全基因测序可能在使用鸟枪法的同时,还应该联合BAC文库测序等多种方法.对这些数据进行了初步的组装,获得了130,381条scaffold序列.  相似文献   

5.
利用人类全基因组二代测序数据比较BWA-MEM 和 NovoAlign   总被引:1,自引:0,他引:1  
随着测序技术的发展,二代测序数据越来越多,将测序数据准确地比对到参考基因组是后续研究的基础.BWA-MEM和NovoAlign作为2个最常用的DNA序列比对软件,还没有评估其在基因组中不同结构区域的表现.本研究基于真实和模拟数据,对2个软件在人类基因组的低复杂度、片段性重复和其他区域进行了评估.结果显示:BWA-MEM将尽可能多的测序数据比对到基因组,且在低复杂度和片段性重复区域存在过度比对的现象,特别是在片段性重复区域的比对品质较低;而NovoAlign比对到基因组的序列数量低于BWA-MEM,但在片段性重复区域的比对品质较优,因此对于存在较多片段性重复区域的基因组来说,使用NovoAlign比对是一种更好的策略.   相似文献   

6.
本实验旨在对绵羊肌肉转录组进行组装分析,以丰富绵羊的基因组并为进一步对绵羊的相关基因的分子遗传学研究奠定基础。选取Illumina Hiseq 2000测序平台对杜泊羊和小尾寒羊的骨骼肌转录组文库进行了高通量测序,并对测序数据进行从头组装分析。结果表明:两个测序文库共得到103058824个长为2×90bp的高质量的测序序列,经从头组装共产生了145524个unigenes。两个文库间有5718个unigenes差异表达,经GO注释分析后发现它们主要分布在细胞、细胞过程和结合条目中。将两个文库的unigenes进一步组装得到70348个平均长为863bp的all-unigenes,其中35201个被注释到Nr数据库,12219个被注释到COG数据库,并与KEGG数据库中的258个功能通路中的蛋白质和氨基酸新陈代谢通路密切相关。  相似文献   

7.
正基因组设计合成是对基因组进行全新设计和从头构建,能够按需塑造生命,开启从非生命物质向生命物质转化的大门,推动生命科学研究由理解生命向创造生命延伸。然而,基因组合成面临长染色体难以精准合成、合成染色体导致细胞失活等难题。天津大学元英进、清华大学戴俊彪、深圳华大基因杨焕明等团队与合作者利用多级模块化和标准化人工基因组合成方法,基于一步法大片段组装技术和并行式染色体合成策略,实现了由小分子核苷酸到活体真核长染色体的定制合  相似文献   

8.
厚叶木莲(Manglietia pachyphylla)为木兰科(Magnoliaceae)木莲属(Manglietia)的木本植物,零星分布于我国广东省和广西壮族自治区,为国家二级重点保护野生植物。了解濒危物种基因组信息及其遗传多样性有助于合理地保护和利用濒危物种,实现濒危物种的解濒和复壮。为此,本研究通过高通量测序方法对厚叶木莲基因组进行测序,并利用测序数据开展厚叶木莲基因组草图的组装;之后,基于组装的基因组预测其中的重复序列和基因,进行系统发育和基因家族分析。结果表明,组装的厚叶木莲基因组大小为2 092 298 891 bp,包含676个组装序列,N50(将组装的序列按照长度由大到小进行累加,当累加到某个序列时,累加的值为基因组50%的长度时,此序列的长度即为N50)为7 961 115 bp;利用BUSCO (Benchmarking Universal Single-Copy Orthologs),针对“eudicots”和“embryophyta”这两个BUSCO单拷贝基因库,对基因组组装的完整性进行评估,组装的厚叶木莲基因组完整性分别为96.6%和98.8%。厚叶木莲基因组有76.5%的序列为重复序列,共有37 900个基因,这些基因编码了41 675个蛋白质序列。系统发育分析发现厚叶木莲与望春玉兰(Magnolia biondii)聚在一起,两者分化时间大致为10 500 000年前。厚叶木莲中与木质部/韧皮部、肌动蛋白丝、热、光合作用以及多种次生代谢相关的基因家族显著扩张,其中次生代谢相关基因在厚叶木莲基因组上呈串联和近端重复,这些基因的扩张和重复形成方式可能与厚叶木莲适应高海拔环境有关。本研究是国内外木兰科木莲属首个基因组报道,为更好地保护和开发厚叶木莲及木兰科其他物种的种质资源提供了遗传信息和参考。  相似文献   

9.
《科技导报(北京)》2009,27(24):14-14
中国首次提出"人类泛基因组"概念 由深圳华大基因研究院领衔、华南理工大学主要参与的合作研究成果"构建人类泛基因组序列图谱"发布,该研究树立了新的人类基因组测序标准,为未来医学研究指明了方向,反映出中国基因组学在世界的领先地位(Nature Biotechnology,doi:10.1038/nbt.1596)。该研究使用深圳华大基因研究院自主研发的第二代测序技术大基因组组装工具,对炎黄一号基因组(即首个亚洲人个人基因组)进行深度测序和拼接,发现了人类基因组中除原先公认的单核甘酸多态性、  相似文献   

10.
由于预训练模型输入分词数量限制,基于BERT的长文本分类任务效果与长文本分割后的文本段集合的处理及特征融合密切相关,现有的长文本分类研究在融合文本段特征时更关注文本段之间原始的顺序关系,而本文提出了一种基于BERT和集合神经网络的长文本分类模型.该方法以BERT为基础,可处理从同一文本样本分割得到的任意数量文本段,经过BERT后得到文本段特征,再将所有文本段特征输入到具有置换不变性的集合神经网络层中,提取出集合级别特征来优化长文本的特征表达.通过在三个数据上的实验分析,论文在平均分词长度较长的数据集上取得了90.82%的准确率,高出目前最优方法4.37%.  相似文献   

11.
全基因组选择是一种用于改良动植物育种群体中数量性状的方法,通过使用覆盖整个基因组的分子标记信息对复杂性状进行预测,从而帮助筛选出更适合培育的亲本.基于长牡蛎的单核苷酸多态性(SNP)位点信息,提出了一种预测长牡蛎肥满度分布参数的全基因组选择的新方法.首先,采用一种基于不同评价准则的二次特征选择方法,挑选与肥满度相关性较高的SNP位点;其次,利用所挑选的SNP位点信息构建具有正则化项的高斯通用加性模型对每个长牡蛎样本肥满度分布参数进行预测;最后,在长牡蛎数据上将所提方法和一些现有方法进行了验证比较.实验结果表明,所提方法具有更好的拟合精度和更低的均方误差,并能对样本性状稳定性进行有效的评估.  相似文献   

12.
单细胞RNA测序(scRNA-seq)数据插补方法用于解决scRNA-seq数据观测中存在的大量“漏失”(dropout)噪音,改善下游分析,scRNA-seq数据插补方法设计是单细胞数据研究的热点方向之一.本文首先对20种主要的scRNA-seq数据插补方法进行介绍,包括基于模型的插补方法(6种)、基于平滑的插补方法(3种)、基于深度学习的插补方法(8种)和基于低秩矩阵的插补方法(3种),分析了各类方法的优势和缺点;其次,简要综述了插补方法比较研究的相关成果;然后,针对4种下游数据分析评估了以上方法(除scGNN外)的性能;最后,分析目前scRNAseq插补所面临的挑战,并指出新的研究方向.  相似文献   

13.
【目的】开发大量可靠的SNP标记,为鹅掌楸高密度遗传连锁图谱的构建和基于基因组的林木选择育种提供分子基础。【方法】从北美鹅掌楸NK基因型为母本、鹅掌楸LS基因型为父本的F1代杂交群体中,选取198株个体为作图群体。用限制性内切酶EcoR I对包括2个亲本和198个子代在内的200个单株的基因组DNA进行酶切,构建RAD(restriction-site associated DNA)文库并进行RAD-seq测序。采用读长为91 bp的双末端测序。2个亲本的平均测序深度为2×,198个子代的平均测序深度为0.8×,平均产量为1.94 Gb,共获得约387.21 Gb数据。用Stacks软件将每个样品的RAD-reads作生物信息学分析,对候选位点进行卡方检验和缺失率检验,再将符合孟德尔遗传的标记及与之相对应的RAD-tag序列和鹅掌楸参考基因组序列进行比对。最后,从本研究开发的SNP标记中选取27个候选SNP位点,设计引物,对随机挑选的16个F1代进行PCR扩增并将结果进行测序,同时验证SNP的有效性。【结果】从候选群体中共鉴定到22 019个SNP位点,符合孟德尔遗传规律的标记为4 233个,最终获得3 501个候选SNP标记。SNP验证中,共有293个SNP标记完成测序并能判读结果,所有位点都为SNP位点,共有194(66.2%)个SNP变异类型得到了验证。 【结论】基于RAD-seq技术和鹅掌楸参考基因组序列为基础的策略,能够作为一种快速有效的手段,实现大规模的分子标记开发,可用于鹅掌楸等林木的高密度遗传图谱的构建。  相似文献   

14.
马克斯克鲁维酵母(Kluyveromyces marxianus)是一种富有潜力的新型细胞工厂宿主菌。K.marxianus FIM1(CGMCC No.10621)基因组组装与注释已于2019年完成并在NCBI上公布(GCA_001854445.2),但在应用该基因组信息时发现其仍不完善。所以本研究使用重测序的DNA-seq数据校验了K.marxianus FIM1的基因组序列,随后补充了K.marxianus FIM1的注释,并使用比较基因组学的方法进一步完善了K.marxianus FIM1的基因组信息。根据重测序比对结果,删除了测序数据无法覆盖的位点61处,共4 910 bp。K.marxianus FIM1新序列总长为10 909 543 bp,可覆盖酵母目保守基因库中99.5%的基因。同时对K.marxianus FIM1的非编码RNA、次级代谢产物基因簇的也进行了补充注释。进一步,我们使用基因组共线性分析的方法分析了K.marxianus FIM1在物种分化过程中基因排列顺序保守的区域,并将K.marxianus FIM1与NCBI公布的11株K.marxianus进行了...  相似文献   

15.
基于地图匹配的导航定位数据模糊校正算法   总被引:3,自引:0,他引:3  
为了提高农用智能移动平台导航定位的精度,改善航线跟踪的质量,提出了一种基于地图匹配的导航定位数据模糊校正算法.首先将DGPS、航位推算定位数据点与地图上已知航线进行对比.判定定位数据点的可信度,然后用该可信度作为加权值生成新的定位数据点即校正数据点,把校正点作为当前农用智能移动平台车体真实位置的估计值.在验证试验中,定位数据经模糊校正后其精度明显优于原始DGPS数据的精度,定位数据的距离均方根差均数从校正前的1.021m提高到校正后的0.568m.试验结果表明,该方法可以在一定程度上提高定位数据的精度,校正大部分可信度低的坏点.  相似文献   

16.
【目的】回顾近些年来在蜜蜂基因组研究领域取得的进展,为后续进一步研究提供参考。【方法】检索蜜蜂高通量测序相关文献并归纳总结,获得高通量测序在蜜蜂基因组中的应用和研究进展。【结果】高通量测序主要应用于蜜蜂线粒体基因组、核基因组和转录组3个方面。目前,蜜蜂属(Apis)下所有9个种的线粒体基因组以及6个种的全基因组已被获得。基于转录组测序分析,一些与蜜蜂重要性状相关的候选基因被靶定。【结论】高通量测序技术的快速发展,使得该技术在蜜蜂基因组学的研究应用范围不断扩大、应用深度不断加深。这为研究蜜蜂分类、系统演化、群体遗传、亲缘关系、群体历史等提供了重要的数据支撑,也为进一步筛选和利用关键基因提供了理论支持。  相似文献   

17.
响叶杨(杨属)叶绿体基因组测序与比较分析   总被引:1,自引:0,他引:1  
本研究中,我们对响叶杨的叶绿体基因组进行测序和组装,并将其与杨属其他11个叶绿体基因组进行比较分析.结果表明,响叶杨叶绿体基因组全长158,591bp,其中两个反向重复序列区(IR)长度均为27,667bp,长单拷贝序列区(LSC)和短单拷贝序列区(SSC)长度分别为84,634和18,623bp.通过对杨属12个物种的叶绿体基因组进行比较,只发现了6个相对较大的插入缺失,因此整体而言,杨属的叶绿体基因组结构是高度保守的.系统发育分析结果显示,杨属中12个物种组成了3个具有高支持率的进化支,响叶杨与其他白杨组物种聚为一支,并且与银白杨的亲缘关系最近.本研究基于叶绿体基因组数据揭示了杨属的进化历史,将有助于进一步开展杨属植物基于叶绿体DNA序列数据的群体遗传学及其他分子生态学研究.  相似文献   

18.
针对目前基于测序的结构变异检测方法检测效果较差的问题,提出了基于序列拼接的长插入变异(ISALins)检测方法。首先融合3种不同检测工具初始的检测结果,然后在初始的预测可疑断点附近分析和提取最可能包含插入信息的高质量软切片段,并比对失败的片段;将这些候选片段利用基于De Bruijn图的方法进行拼接后完成长插入变异的检测。仿真数据和真实数据的实验结果表明:与直接融合多个单一工具检测结果相比,本文方法可以在确保检测敏感度的前提下大幅提高长插入变异的检测精度。  相似文献   

19.
超、特高压长线路光纤纵差保护数据同步   总被引:2,自引:0,他引:2  
分析了目前在实际光纤纵差保护中应用的数据同步方法的缺点,尤其是SDH(synchronous digital hierarchy)光纤自愈环网中收发数据路由不一致导致线路两侧保护装置采样数据不同步问题,提出了一种适用于超、特高压长线路光纤纵差保护的采样数据同步方法,即基于时钟校正法,并通过精确线路模型的在线计算对时钟做进一步补偿校正的方法.EMTP仿真验证该方法的误差小于0.5μs.理论分析和仿真结果证明了该方法保证线路两侧保护装置采样数据同步的有效性及应用于超、特高压长线的可行性.  相似文献   

20.
MPEG-2传输流再复用器的设计   总被引:6,自引:0,他引:6  
提出一套MPEG—2传输流再复用器的设计方案。该方案采用CAM RAM组合代替简单的RAM结构用于构造PID信息表,在保证速度的基础上,大大节约了资源;提出了“两步法”PCR校正算法,在保证节目时钟基准(PCR)校正精度的基础上,大大减小了硬件设计的复杂度;基于该再复用器,提出了MPEG—2传输流、纯数据、主控机插入等几种实用的数据插入方式,以适应不同的应用环境。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号