首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
一种基于结构域的蛋白质功能分类预测新方法   总被引:1,自引:1,他引:1  
俞晓晶  林建成  石铁流  李亦学 《科学通报》2004,49(20):2072-2077
从已知的蛋白质序列数据出发,预测蛋白质的功能是生物信息学研究的一项重要任务。常见而有效的一种方法是将蛋白质按照其序列特征归并到不同的功能类中去。据此我们应用最大似然估计(MLE)算法,发展了一种以蛋白质结构域组成特征为基础的方法,对蛋白质进行功能分类。我们对酵母(Saccharomyces cerevisiae)基因组用MLE方法和文献中记载的另一种方法进行了预测,并对两种方法进行了比较。结果表明MLE方法预测明显优于文献中记载的另一种方法。MLE方法的特异性达到75.45%,敏感性达到40.26%。这个结果也说明结构域是蛋白质的一个重要特性,它与蛋白质的功能紧密相关。  相似文献   

2.
蛋白质功能基团三维模体及其应用   总被引:5,自引:2,他引:3  
叶玉珍  解涛  丁达夫 《科学通报》2000,45(12):1243-1251
用一维序列模体和三维结构模体刻画与识别蛋白质功能区是蛋白质功能预测和分子设计中的重要课题。目前三维模体的提取与搜索均以残基为单位进行。特异性有限。鉴于残基的功能基团才是其发挥功能的关键要素,提出以功能基团为单位来表征三维模体(称为功能基团三维模体),并发展了相应的搜索算法,用于阐释蛋白质功能的结构基础以及预测未知蛋白质的功能。以从胰蛋白酶(PDB代码为1mct)中提取的“三联体和氧穴”功能基团三维  相似文献   

3.
基于复合金字塔模型的蛋白质二级结构预测系统   总被引:1,自引:0,他引:1  
杨炳儒  谢永红  侯伟  周谆 《科学通报》2009,54(21):3311-3319
利用预测系统方法, 对蛋白质二级结构预测提出了一种逐步求精、多层递阶的预测系统模型, 即复合金字塔模型. 这种模型由4个独立协同的层面组成, 通过智能接口有机融合了SAC, AAC, KDD*等源于KDTICM理论的模型和方法. 模型整体贯穿物化属性与结构序列, 采用因果细胞自动机选择有效物化属性, 构造纯度较高的结构数据库作为训练数据源, 利用领域知识与背景知识进行优化. 本模型在数据集RS126及CB513分别取得83.06%与80.49%的Q3准确度, 在对偏α/β型蛋白质的预测实验中, 取得了93.12%的Q3准确度, 并存在着进一步提高准确度的优化空间.  相似文献   

4.
SARS-CoV蛋白质组的生物信息学及其进化关系   总被引:6,自引:1,他引:6  
柳树群  过涛  季星来  孙之荣 《科学通报》2003,48(13):1359-1368
一种新的冠状病毒 SARS-CoV是引起严重急性呼吸综合征(severe acute respiratory syndrome, SARS)的病原体. 对由SARS病毒全基因组序列推导出的所有蛋白质逐一进行分子量、等电点、分子消光系数等物理化学性质计算, 以及跨膜区和亚细胞定位预测, 辅以保守序列家族数据库搜索, 预测SARS-CoV功能未知蛋白质的功能. 同时, 通过SARS-CoV与其他冠状病毒蛋白质同源序列比较和进化距离计算, 分析SARS病毒的分类地位以及与其他冠状病毒的进化关系. 结果表明, 尽管SARS病毒是不同于其他3组冠状病毒的一种全新冠状病毒, 但在进化关系上更靠近牛冠状病毒BoCoV和鼠肝炎病毒MHV. 为实验测定SARS病毒蛋白质组以及抗SARS疫苗研制提供了参考和帮助.  相似文献   

5.
<正>传统的材料研发主要依赖研究者的科学直觉和不断反复的"尝试法"实验,从新材料的设计到新材料的应用一般需要花费10~20年.为了加快新材料的研发过程,降低研发成本,利用计算机技术高通量地预测和筛选具有特定功能的新材料已成为全世界化学与材料科学研究的新热点.近年来,计算机技术在新材料研发的各个环节正发挥着越来越重要的作用.例如,计算机技术可以用来从理论上预测大量未知的新材料,然后根据理论化学计算排除那些实际上不合理的假  相似文献   

6.
大规模蛋白质相互作用数据的分析与应用   总被引:10,自引:2,他引:8  
孙景春  徐晋麟  李亦学  石铁流 《科学通报》2005,50(19):2055-2060
蛋白质相互作用在生命活动中起着重要的作用. 目前已开发出几种实验和计算方法能够得到大规模蛋白质相互作用数据. 但是, 与传统的实验结果相比, 蛋白质相互作用大规模数据中存在着比例较高的假阳性. 为了能够充分利用这些数据, 需要建立生物信息学方法对这些数据进行系统的评价, 进而提高数据的可信度, 并从中挖掘出有价值的生物信息. 本文对目前蛋白质相互作用大规模数据的计算分析和应用进行了总结, 包括蛋白质相互作用数据评估方法、与蛋白质其他信息的关系以及在生物学研究中的应用, 并提出了开发分析和挖掘蛋白质相互作用数据工具的主要方向, 以期有助于这些数据的研究和应用.  相似文献   

7.
蛋白质翻译后修饰研究进展   总被引:5,自引:0,他引:5  
胡笳  郭燕婷  李艳梅 《科学通报》2005,50(11):1061-1072
蛋白质翻译后修饰在生命体中具有十分重要的作用. 它使蛋白质的结构更为复杂, 功能更为完善, 调节更为精细, 作用更为专一. 常见的蛋白质翻译后修饰过程有泛素化、磷酸化、糖基化、脂基化、甲基化和乙酰化等. 泛素化对于细胞分化与凋亡、DNA修复、免疫应答和应激反应等生理过程起着重要作用; 磷酸化涉及细胞信号转导、神经活动、肌肉收缩以及细胞的增殖、发育和分化等生理病理过程; 糖基化在许多生物过程中如免疫保护、病毒的复制、细胞生长、炎症的产生等起着重要的作用; 脂基化对于生物体内的信号转导过程起着非常关键的作用; 组蛋白上的甲基化和乙酰化与转录调节有关. 在体内, 各种翻译后修饰过程不是孤立存在的. 本文对上述几种类型的蛋白质翻译后修饰的研究近况进行了综述, 讨论了各种翻译后修饰形式相互影响、相互协调的关系.  相似文献   

8.
蛋白质的谱维数   总被引:1,自引:0,他引:1  
李后强 《科学通报》1993,38(8):705-705
由于蛋白质的性质和功能与其内部原子的振动、链构象有密切关系,因此人们从振动简正模式分析、分子动力学及Monte Carlo模拟等方面对蛋白质作了大量研究.Wako等人发展了一套计算蛋白质构象能的快速方法,Go等人提出了研究蛋白质低频振动模式的动力学方法,并计算了牛胰蛋白酶抑制剂(BPTI)的简正模式密度分布.我们近年对蛋白质的分形  相似文献   

9.
钩端螺旋体蛋白质相互作用网络预测与系统分析   总被引:1,自引:0,他引:1  
问号钩端螺旋体是一种致病菌, 能够引起人畜共患病. 该细菌全基因组序列测序的完成, 为从全蛋白质组学的角度分析蛋白质相互作用网络提供了基础. 本研究通过整合4种计算方法(基因融合法、基因邻居法、系统发生谱法和操纵子法)来预测钩端螺旋体赖株蛋白质相互作用网络. 对运动和趋化系统、信号传导系统、脂多糖生物合成以及黏附、侵袭等有关蛋白质之间的相互作用进行了详细分析. 除此以外, 根据蛋白质的相互作用网络以及功能分类, 预测了203个未知蛋白质可能的功能. 这不仅为进一步研究钩端螺旋体赖株的致病机制提供了一个资料, 也为在基因组范围内应用生物信息学方法研究微生物提供了一个实例.  相似文献   

10.
《科学通报》2021,66(3):284-299
机器学习的目标是设计可以根据先验知识和观测数据不断改进其性能的算法.该算法可以帮助机器从大量的数据中提取知识,从而提升其在特定任务上的性能.作为数据驱动的方法,机器学习可以有效利用高通量实验技术产生的大批量生物数据,实现合成生物体的功能预测与智能化设计,改变合成生物学的研究范式.本文首先介绍机器学习在合成生物学领域广泛应用的几个模型及方法,如支持向量机、神经网络、生成式对抗网络、深度强化学习等.然后介绍机器学习方法在合成生物学领域的典型应用,如启动子预测、酶催化设计、代谢途径构建、基因线路设计等.本文综述面向合成生物学的机器学习方法及应用,并试图启发读者如何选择和设计机器学习方法用于合成生物学的研究.  相似文献   

11.
Creighton  TE  范宗理 《世界科学》1989,11(1):24-24
直到目前,蛋白质的折叠仍还是相当神秘的问题。由于蛋白质的结构错综复杂,所以难以被理解和预测。线性多肽链是如何折叠成复杂的立体结构的呢?对此的答案,只不过是推测而矣。实验数据很少是有效的。未折叠的蛋白质和不完全的结构区呈现着随机的螺旋形。被分析的多数折叠转移都是相互纠缠在一起的;而且可用于确定折叠方式的部分折叠的中间物并不大量出现。可用于解释折叠方式的动力学被由临近脯氨酸残基肽链的较慢的顺反式异构化作用引起的蛋白质的异源性所搞乱。出现在活体内的折叠非常有效,实际是无法看见,并不可能对其进行研究。美国科学促进会(AAAS)在波士顿召开的为期3天的专题讨论会,搞清了所发生的许多变化。大量热心的与会者,对该领域进行了广泛的评价,从小肽的构形特点到体内折叠以及复杂病毒蛋白质的装配;从了解较清的去垢剂(一种改性的枯草杆菌蛋白酶)问题,到凝胶原中的缺失所造成的医学问题。  相似文献   

12.
生物信息学的通天塔   总被引:1,自引:0,他引:1  
对各种完整基因组的测序是一种重大的成就,但是由此所积累的大量数据才刚刚开始得到阐释。乍看来,任务(理解这些数据)是很直接了当的:对各种基因进行定位并对编码区进行翻译以建立它们的蛋白质产物;进行相似性(similarity)检索以与已知序列建立关系,并且通过进化关系上的推断来确定基因的功能;最后,使用已知的或者模型衍生的结构来根据结构推断功能。鉴于使用的数据量大,此过程应该尽可能自动化。 当然,现实不是这么简单。因为目前用来在未知DNA中预测基因的那些方法是不可靠的,诠释隐藏在基因组数据中的线索的努力经常受…  相似文献   

13.
周艳红  周权雄  刘怀兰  万宏辉 《科学通报》2005,50(20):2235-2239
家族性扩张型心肌病(FDC)是一种以常染色体显性遗传为主的单基因病, 迄今已定位了15个常染色体显性遗传FDC的疾病基因区间, 但只确定了其中8个定位区间的致病基因, 另外7个定位区间中的FDC疾病基因仍有待发现. 本文对已知的FDC疾病基因序列进行了深入分析, 发现其密码子使用频率分布具有显著的特异性, 并设计了基于这种特征预测FDC疾病基因的新方法. 交叉验证结果表明, 该方法能够从定位区间内众多的基因中有效预测出FDC疾病基因. 除具有较高的预测精度外, 该方法的另一显著优点是只需要知道基因序列数据, 因而有可能帮助发现那些功能还完全未知的FDC疾病基因. 在此基础上, 用该方法对疾病基因还未知的7个FDC定位区间进行了分析, 给出了FDC疾病基因的预测结果和预测软件(http://infosci.hust.edu.cn), 可为相关实验研究发现新的FDC疾病基因提供帮助.  相似文献   

14.
随着国际上转录组数据及本室22周孕龄人胎肝表达序列标签数据的不断增加, 先前该组织表达谱的研究有必要进行更新与完善. 本研究首先将22周孕龄人胎肝每一表达序列标签与自身数据库, UniGene, DoTS, MGC以及Twinscan预测的人类转录组数据库进行比对以归类. 然后, 经过电子拼接和基因鉴定, 对已知基因进行GO (gene ontology)分类, 对未知基因进行Pfam和ScanProsite功能预测. 最后, 对人胎肝、成人肝、骨髓、胸腺及淋巴结这些拥有造血作用或可表明人胎肝特性的5种组织进行了层次聚类分析. 结果表明: (ⅰ) 与5种最新人类转录组数据库比对, 极大地降低了那些属于一个基因但互不交叠的序列被划分到不同簇的可能性, 因此在进行EST归类时, 推荐与互联网上有关最新数据进行比对; (ⅱ) 一些先前未知EST已被鉴定为已知基因, 1379个EST被鉴定为本室独有的全新序列; (ⅲ) 通过GO分类, 对22周孕龄人胎肝有了一个大致了解, 同时获得了6个细胞迁移基因和6个造血相关基因; (ⅳ) 通过基因功能预测获得了277个模体(profile), 其中有5个类型可分布于10个以上基因之中; (ⅴ) 层次聚类表明, 5种组织关系与它们的功能相一致; (ⅵ) 建立了世界上最大的22周孕龄人胎肝表达序列标签数据库. 总之, 22周孕龄人胎肝表达序列标签数据的更新与初步分析将有助于对人胎肝造血机制及细胞迁移机制的了解, 可促进未来对该组织进行全面深入的研究.  相似文献   

15.
钱若兰 《科学通报》1995,40(3):268-268
HMG蛋白质是一类酸溶性的非组蛋白质,虽然这类蛋白质在染色质内的含量非常丰富,但有关它们的生物学功能目前依然不清楚.本文对HMG蛋白质(1+2)与β-CAT质粒DNA相互作用的模式进行了初步分析.实验结果表明这类蛋白质能促使β-CAT质粒DNA解螺旋,此外,在质粒DNA的局域部位,还能观察到DNA环结构的形成.  相似文献   

16.
黄海燕  周翔 《科学通报》2023,(30):3887-3898
G四链体是一种非经典的核酸二级结构,并且已经被证实大量存在于多种生物基因组及转录组中的关键调节位点.由于其特殊的四链结构, G四链体能够与多种功能的蛋白发生相互作用,从而参与生物体多种生理及病理过程的调控.因此, G四链体互作蛋白的结构及功能研究将有利于进一步揭示G四链体的生命活动调节机制,促进开发G四链体及其互作蛋白作为疾病治疗靶点的新型治疗方法.近年来,得益于核酸-蛋白互作研究方法的进步及G四链体互作蛋白研究新技术的开发,科学家已经发现了多种功能各异的G四链体互作蛋白.本文简要介绍了已知G四链体互作蛋白的种类和功能,综合评述近年来G四链体互作蛋白研究方法的发展,并对未来的发展方向进行展望.  相似文献   

17.
苏煜  李文飞  张建  王骏  王炜 《科学通报》2007,52(21):2487-2493
在原子水平上发展了一种距离相关的用于研究蛋白质-蛋白质相互作用的平均势(potential of mean force, 简称PMF)方法. 与传统理论模型相比, 我们的模型考虑了蛋白质系统的复杂环境因素. 这种改进使得该模型能够给出物理上更合理和准确的势函数形式. 得到这样的势函数是正确描述蛋白质结构及相互作用的前提条件. 而且借助于改进后的方法, 还可以对蛋白质中残基相互作用的空间拓扑规律进行研究. 期望这种改进将促进平均势方法在蛋白质科学其他领域, 如蛋白质折叠识别, 结构预测及热稳定性预测中的应用和发展.  相似文献   

18.
刘宏德  王睿  卢小泉  陈晶  刘秀辉  丁兰 《科学通报》2007,52(23):2742-2745
基因组数据中大约有20%~30%的基因产物被预测为膜蛋白, 膜蛋白是一类具有重要生物功能的蛋白质. 预测膜蛋白跨膜区的数量和位置是生物信息学中重要的研究课题. 提出了一种预测膜蛋白跨膜区的新方法—— 连续小波变换极大值谱(MSCWT). 该法对8种SARS-CoV膜蛋白的预测准确度与常用膜蛋白预测软件TMpred相当, 对MPtopo数据库中131种新的已知结构的螺旋束蛋白(共包含548个跨膜区)的预测显示, 其跨膜螺旋区预测准确率为91.6%, 膜蛋白序列的预测准确率为89.3%.  相似文献   

19.
利用EST及生物信息学方法挖掘马铃薯中miRNA及其靶基因   总被引:4,自引:0,他引:4  
郭强  项安玲  杨清  邱承祥  杨志敏 《科学通报》2007,52(14):1656-1664
microRNA (miRNA)是一类调控真核基因转录后表达的非编码小分子RNA. 大量研究表明, miRNA在调节生物功能方面起着重要的作用. 目前发现miRNA的主要方法有直接克隆法和基于生物信息学的基因搜索和同源搜索. 由于真核生物组织中有些miRNA的丰度较低, 而且其表达具有组织和时序特异性, 采用直接克隆法发现新的miRNA有时较为困难. 采用生物信息学方法寻找未知miRNA是当前发现和鉴定miRNA的重要策略之一. 本研究联合了几种生物信息学方法预测了马铃薯(Solanum tuberosum)中miRNA及其靶基因. 通过把拟南芥、水稻等植物已知的miRNAs与马铃薯EST数据库进行比对搜索, 筛选出候选的miRNA. 之后, 设置一系列严格的筛选标准, 分析候选miRNA序列特征, 包括碱基错配、二级结构、(A+U)含量、能量水平等. 最后, 从上述候选库中筛选出了22个miRNA. 进一步利用新鉴定的miRNA序列, 预测到43个靶基因. 分析结果表明, 上述大多数靶基因编码的产物为转录因子及重要代谢酶类, 它们调控着植物的生长发育, 信号转导及各种胁迫反应.  相似文献   

20.
改变蛋白环区序列是功能蛋白质设计的重要方法,运用环区数据库的最新统计结果,凭借精确快速的环区构象计算程序,将分子对接算法与组合化学策略结合,提出了用计算机模拟筛选组合肽库以获得功能蛋白的合理方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号