首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 625 毫秒
1.
以基因组序列为原始数据,利用反映序列分子结构的数字编码形式,对其进行重新编码.对编码后的序列主要采用谱分析的方法进行处理,通过对不同内含子含量的序列的分析和比较,研究了基因组序列的相关性以及非编码区对序列结构的可能作用,探讨与其生物功能相关的含义.  相似文献   

2.
本项研究构建的数据库包括了Escherichia coli O157:H等七种微生物的全部基因数据、CDS的数据,以及其相关信息,因为这七种微生物在进化上的关系比较近,有利于开展进一步的基因比较研究,以便从中得到各自的特征,或进行同源性的研究;也可以提供给普通用户进行检索。本项研究的所有数据来自于NCBI,通过对下载的原始数据进行整理和提取,建立了自己的数据库,以方便进一步研究使用。数据库的构建采用的是当前最为流行、稳定、高效的网络数据库工具软件组合,即:Apache PHP MySQL组合。使用PHP解析原来的原始数据,然后写入MySQL构建的数据库中。MySQL数据库中把数据分成三个模块,Features表中主要是基因特性的相关数据,象基因编码序列、基因功能等;Reference中是这些基因的相关文章的索引,Main中存储的是完整的基因组数据和所有这些基因组的全序列数据、分类、以及到其他数据库的索引等数据。使用PHP解析数据时,根据NCBI原始数据结构模型和自己构建的数据库结构,使用了针对关键字的方法,把原始数据提取到自建的数据库中。数据库提供复合查询界面,用户可以通过查询界面按照多种条件对数据库进行查询,查询结果以列表的形式列出,可以逐条显示其具体查询结果。  相似文献   

3.
截至2007年1月,世界三大核酸数据库(GenBank,EMBL,DDBJ)库中已经登录来自46个国家和地区的HBV全基因组的8种基因型近900条序列.文中对公共核酸数据库中现有的HBV全部基因组序列进行了统计分析并从基因型的地理分布及其临床特征等方面进行了评述,为进一步研究病毒与宿主的关系,以及HBV的人群分布和进化历史提供帮助.同时,通过系统进化分析对所有登录的229条中国地区HBV全基因组序列及其课题组新近完成的59条全基因组序列进行了基因分型,并根据这些序列建立了中国地区B基因型和C基因型的参照序列,为中国地区HBV的突变研究提供了DNA序列参照体系.此外,对于目前不同数据库信息内容和登录情况进行了分析,提出全面结合宿主临床信息和HBV基因组信息研究的建议。  相似文献   

4.
简单重复序列广泛分布于原核和真核基因组.目前认为SSR主要由DNA复制时聚合酶滑 动导致链错配而形成.SSR在基因组中有其特定作用.某些细菌利用SSR获得"应急基因",以适应 环境变化.而在真核基因组中,SSR被发现可作为功能性的编码和调控元件.启动子区域的SSR在 其基因表达中起增强子作用.由于SSR具有高度多态性,所以可作为一种良好的分子标记应用于 各个领域.目前已对果蝇、线虫、酵母等模式生物做了全基因组范围的SSR探查.这些工作提供了 大量的SSR分子标记,为其更细致广泛的应用奠定了基础.该文就SSR的特征、组成、进化机制以 及功能和应用做了介绍和探讨.  相似文献   

5.
生物序列比对算法的简述   总被引:4,自引:0,他引:4  
基因组和蛋白质组的研究极大地依赖于数据库的搜索,寻求更快更灵敏的生物序列相似性比对算法一直是生物信息学研究的热点,文章介绍了相似性比对的得分算法和各种数据库搜索工具,并对各种算法的优缺点进行了讨论与比较.  相似文献   

6.
通过下载国际一级序列数据库GenBank的序列数据,开发研制了真核生物基因内含子数据库EID,该数据库由一个主数据库和多个子数据库组成,子数据库包括细胞核内含子数据库、细胞器内含子数据库,以及植物、无脊椎动物、灵长类、啮齿类、其他哺乳类和其他脊椎动物等不同类型生物内含子数据库.文中详细介绍了数据的获取和筛选方法,主数据库中dEID,pEID,hEID的文件格式和结构,EID数据库构建程序,以及EID的查询方式,提供的分析工具等.EID将建设成为研究内含子功能和进化起源的生物信息学平台.  相似文献   

7.
基因组序列中蛋白编码区的正确预测是后基因组时代的一个重要工作.采用分解子序列的方法将DNA序列映射为数值序列,然后对其进行功率谱分析,DNA序列的功率谱曲线的峰值位置刚好和编码区序列相对应,从而实现了对基因组序列编码区的预测.理论分析和大量计算机实验证实了方法的有效性,预测的探测率和正确率分别达到97%和88%,预测效果良好.该方法不需要基因组序列的任何先验知识,应用面广.  相似文献   

8.
美国加州大学伯克利分校的NicoleKing等生物科学家在2008年2月14日的《自然》(Nature)上发表论文.表明他们已确定海洋生物领鞭毛虫(Monosiga brevicollis)的基因组序列。  相似文献   

9.
本书是《机器感知与人工智能》丛书的第57卷。主要内容为现代信息系统存储的时间数据中预处理、挖掘与解释中的某些新进展,并将时间维数加到数据库中产生时间序列数据库(TSBD)。书中介绍了数据挖掘与知识发现中的新的状况与挑战。其中包括寻找时间序列数据的有效表达方法,测量时间序列的相似性,检测时间序列的改变点以及时间序列的分类与聚变。  相似文献   

10.
严重急性呼吸综合症(Severeacuterespiratorysydrome,SARS)是一种全新的传染性疾病,它可能主要是由冠状病毒的一个变种引起的.本文比较SARS及其它冠状病毒基因组组织结构和序列变异的情况,初步的结果表明:①尽管SARS病毒与冠状病毒属的另外6种病毒基因组序列上有较大的差异,但是它们具有较相似的基因组组织结构;②SARS病毒与牛冠状病毒、鼠肝炎病毒具有较近的系统发育关系;③虽然SARS病毒扩散的时间极短,但来自不同地区SARS病毒的DNA序列却存在一些突变,且这些突变又大多是改变氨基酸序列的非同义突变.  相似文献   

11.
动物线粒体基因组全序列测定是近年来生物学研究中的一个热点。科学技术的发展,对动物线粒体基因组全序列测定的研究策略也产生了深远的影响。在此对几种在动物线粒体基因组全序列测定中常用的几种策略进行了综述,并对其优缺点进行了比较分析。  相似文献   

12.
【目的】杨树是重要的速生用材、生态防护和碳汇造林树种,也是林木遗传研究的模式树种。开展杨树泛基因组构建与基因组变异分析,可为杨树精准育种和林木泛基因组研究提供理论先导。【方法】 以公开发表的高质量杨树基因组序列为基础,分析不同类型的序列变异,总结变异特征,并构建基于基因和图形结构的杨树泛基因组。【结果】 本研究收集到8个杨属树种和3个二倍体或三倍体杨树杂交品种的基因组序列,3个杂交品种包含7个单倍型亚基因组序列,较好地代表了杨树4个组派的基因组特征。分析结果表明,杨树基因组间存在较多大的结构变异。在基于基因的泛基因组中,共线核心基因、非共线核心基因、次核心基因、非必需基因、特异基因占比分别为12.5%、34.9%、31.4%、16.5%、4.7%。其中,非必需基因在功能上具有较高的多样性。以基因组序列变异为基础构建杨树图形结构泛基因组,大幅提升2代测序数据的变异检测效果。通过泛基因组变异热点分析,鉴定出2个与物候关联的基因位点。【结论】 杨属基因组中存在大量染色体重排,进而增加了基因调控的多样性。杨树组/派间的基因组结构变异可能与物候适应存在关联。基于林木基因组序列的复杂性,在林木泛基因组研究中应注意基因组整合范围与研究目标相匹配,结合基因泛基因组和图形结构泛基因组结果,综合解析林木的遗传变异规律和物种演化特征。  相似文献   

13.
微生物基因组测序在当今生命科学领域的研究中起着重要作用.本文通过对主要测序方法一鸟枪法的介绍,阐明了微生物全基因组序列的测定与注释在基因组学的进一步研究中的广阔领域.  相似文献   

14.
ERIC序列在不同细菌基因组中分布的分析   总被引:16,自引:2,他引:14  
重复 DNA序列是细菌基因组中的一个重要组成部分 ,而 ERIC(IRU )序列是在肠道细菌基因组中发现的一类基因间重复序列。本研究使用 HMMER软件建立 ERIC序列族的模型 ,并用该模型对 4 6个已测序的菌株进行全基因组序列搜索 ,并对搜索结果进行比较分析 ,找出 ERIC(IRU )序列在不同细菌基因组中的分布规律 ,即 ERIC序列主要存在于肠道细菌中 ,并不是在细菌基因组中普遍存在的  相似文献   

15.
文章研究了利用序列模式的挖掘结果对序列数据库进行再发现的问题,提出一种利用已发现序列模式对数据库中的数据序列进行聚类的方法SPSC.该方法利用发现的序列模式定义了数据序列之间相似度函数和数据序列分组的平均值,使得经典聚类方法k-means可以应用于序列型数据,实现了对包含相似模式的数据序列进行聚类;理论分析和实验表明,与已有的序列聚类方法相比,该文所提出的方法不仅可以得到更加优化的聚类,而且效率更高.  相似文献   

16.
Circos软件是一款功能强大的用于基因组比较分析数据可视化的图形生成软件,但是该软件需要使用者自己编程提取所需数据,因此如何将基因组注释和比较分析结果与该软件衔接是个非常实际的问题.这里,我们开发了一个能够将基因组数据快速与Circos~([1])软件衔接的工具一Geno2Cir.这个工具可以处理对位排列好的基因组数据,进行物种间序列差异的比较,得到能够直接用于生成Circos图像的文件.本工具不仅可以进行基因组之间的两两比较,也可以进行多个基因组之间的同时比较.前者利用窗口步移法进行序列之间的直接比较,后者利用K2P(Kimura-2-parameter)方法先计算两两序列之间的距离,然后得到所有序列之间的距离矩阵之后再计算总体的差异.这一工具可以应用于裸子植物松属物种的叶绿体基因组,以及亲缘关系较远但是序列差异较小的凤蝶总科线粒体基因组的比较.  相似文献   

17.
利用GenBank中欧洲鲇的线粒体基因组序列, 设计出6对引物, 通过PCR扩增产物直接测序和引物行走(primer walking)法测定了兰州鲇的线粒体基因组序列, 并对其进行结构分析。兰州鲇线粒体基因组序列全长16524 bp, 包括37个基因(2个rRNA基因、22个tRNA基因和13个蛋白质编码基因)和1个非编码区。用最大似然法对鲇形目11种鲇鱼线粒体基因组的13个蛋白质编码基因的核苷酸序列进行系统发育分析。结果显示, 兰州鲇首先跟其他鲇科鱼类聚为一支, 形成一个单系群, 位于系统发育关系树的中部。  相似文献   

18.
生物源活性氧(reactive oxygen species, ROS)是环境ROS的重要来源,在生物元素地球化学循环中发挥着重要作用.但目前关于产ROS微生物的生物学信息尚不完善,影响微生物ROS产生的因素也未知.为此从近海沉积物中分离得到一株产胞外ROS的假交替单胞菌GCY(Pseudoalteromonas sp.GCY),利用全基因组测序表征了其潜在生物学功能.结果表明菌株GCY基因组大小为5.47 Mb, GC含量为43.39%,与胞外ROS产生相关的基因包括lodA、lodB和nqrA-F等.此外,氨基酸和Na+被证实影响胞外ROS的产生.进一步通过比较基因组分析,推测具备产胞外ROS能力的微生物在环境中广泛存在.综上,提供了产胞外ROS微生物全基因组分析报告,在分子水平上加深了对生物源ROS产生的理解,为开发利用各种环境中生物源ROS及认知生物源ROS的环境意义提供了重要视角.  相似文献   

19.
介绍利用常见的x86 PC,Linux操作系统配合BLAST、PHYLIB和EMBOSS等常见的生物分析软件构建可以完成多种蛋白数据分析的大规模自动分析系统.该系统可自动完成从DNA序列中获取读码框、核酸序列向蛋白序列的转化、在蛋白序列数据库中查找同源序列、序列录入数据库以及蛋白序列的等电点、亲/疏水位点、二级结构等性质的分析、多个序列之间相似度和进化地位的分析,并对输出的结果数据利用Web服务器进行发布.与传统的序列分析模式相比,此分析系统大大加速了对大规模数据信息的分析和利用.  相似文献   

20.
通过特征提取方式挖掘生物信息数据中潜在的规律是生物信息学研究的基本问题之一。基于DNA序列的碱基转移概率、含量和位置比三类特征构造了24维特征向量,成功应用于11物种的β-珠蛋白基因完整编码序列和18哺乳动物线粒体基因组序列的相似性比较,构建的系统发生树与进化事实相符。基于该特征向量,结合支持向量机分类方法识别了28株细菌中的必需基因,平均AUC值高达0.808,高于部分识别方法。实验结果说明:生物序列基本构成元素的转移概率、含量和位置比可作为研究生物信息学中相关分类问题的选择性工具。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号