首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 531 毫秒
1.
蛋白质二级结构预测中的简化编码技术   总被引:2,自引:0,他引:2  
神经网络用于蛋白质二级结构预测时,通常氨基酸序列采用正交二进制编码。基于不同残基间的物理化学性质,提出了简化的编码技术,并与其他蛋白质二级结构预测的方法进行了比较。实施结果表明:这种方法更充分地利用了蛋白质一级结构的信息,有较好的效果。  相似文献   

2.
用4肽结构字预测蛋白质二级结构   总被引:2,自引:0,他引:2  
介绍一种新的方法来预测蛋白质二级结构.该方法是基于4肽结构字的基础上,利用4肽结构字建立多样性源同时结合二次判别法来预测一个序列片段中心残基的二级结构,最后对预测后的结果进行修正.对1645个蛋白进行检验,其21残基片段中心残基,10折交叉检验的结果Q**3(Q3score)达到79.68%.当考虑长程序列信息时,预测将会更精确.与其它预测软件相比较,显示了一定的优势.  相似文献   

3.
为提高蛋白质二级结构预测的精度,提出了一个由5个子网络集成的多模神经网络模型,预测结果由5个子网络综合得到。对于每个子网络采用神经网络分级思想分为二级网络,一级网络采用含进化信息的profile编码蛋白质序列作为输入,二级结构作为输出。二级网络编码一级网络输出结果作为输入,并将蛋白质序列用改进正交编码方式作为另一输入来提高二级网络的预测精度,输出仍为二级结构。采用子网络差异方式进行单独训练,结果表明该方法最终的预测精度达到71.3%,较大提高了蛋白质二级结构的预测精度。  相似文献   

4.
蛋白质二级结构预测时,描述窗口内氨基酸残基序列的各种物理化学和分子结构参数的数量非常大,而且不能很好地直接体现氨基酸的连接顺序,这样就造成二级结构预测工作既费时效果又低下,因此,对这些数据预处理是非常必要的.研究发现,这些初始数据对应的变换矩阵的本征值谱与氨基酸残基序列情况无关,只与氨基酸的类别、数量性质有关,而其本征函数数据能够直接反映氨基酸残基的序列情况,利用有显著大小的本征值对应的本征函数作为描述参数,在进行蛋白质二级结构预测时,不但能够显著减少描述参数的个数,而且它体现了氨基酸顺序的变化,这将有效提高蛋白质二级结构预测研究效果.  相似文献   

5.
基于改进BP神经网络预测蛋白质二级结构   总被引:6,自引:0,他引:6  
蛋白质结构预测在生物信息学研究中占有重要地位,而蛋白质二级结构预测是蛋白质结构预测的关键步骤。针对标准BP算法存在的缺点,讨论采用几种不同的改进BP神经网络来实现蛋白质二级结构的预测,运用MATLAB语言实现各种改进算法的初始化和训练。并分析比较了它们对蛋白质二级结构预测精度的影响。实验表明,遗传算法结合动量法与学习率自适应调整策略的BP算法可获得较高的预测精度。  相似文献   

6.
本文在工作[1][2]的基础上进一步研究了蛋白质二级结构的经验预测,着重讨论了如何制定预测规则的问题,并将预测工作计算机化.在蛋白质资料库中随机选取了21个蛋白质(3296残基)进行预测,正确率对α螺旋和β折迭分别为84.4%和81.9%.  相似文献   

7.
针对水稻蛋白质二级结构预测研究,查阅了国家水稻数据中心文献资源,基于国际蛋白质数据库(protein data bank, PDB),选择具有代表性的蛋白质(5XQI)作为样本,应用BP神经网络建模技术,对水稻蛋白质二级结构进行预测研究。结果表明:先用氨基酸描述子量化一级结构,再用主成分分析综合描述子,能简化模型结构,提高模拟预测准确度和运行速度;构建标量型的人工神经网络模型和仿真函数预测式,简捷直观,应用方便;适宜的模型结构为21∶20∶3,即21个输入层节点、20个隐含层神经元、3个输出层神元的BP神经网络模型结构;模型的整体拟合准确度为0.85,H、E、C三种二级结构的拟合准确度分别为0.92、0.79、0.81;整体预测准确度为0.72,三种二级结构的预测准确度分别为0.79、0.65、0.71。基于BP神经网络的水稻蛋白质二级结构预测模型的拟合、预测准确度比以往同类研究高,为水稻蛋白质二级结构预测提供了一种新的研究方法。  相似文献   

8.
一种改进的Bayesian网络模型用于蛋白质二级结构预测   总被引:3,自引:0,他引:3  
分析了蛋白质二级结构预测问题的Bayesian模型,给出了基于这种模型的神经网络,并提出了一种改进的网络模型,通过实验表明这一新模型能较好地处理蛋白质二级结构预测问题.  相似文献   

9.
基于小波分析法的蛋白质结构研究   总被引:3,自引:0,他引:3  
用小波的方法预测了一个已知结构蛋白质的二级结构,并把它同互连网蛋白质结构预测服务及其他结构预测软件得到的二级结构进行比较。结果表明:该方法可以较好地确定蛋白质的二级结构且不必进行同源蛋白质序列的联配。在预测未知结构的蛋白质序列方面,该方法与其他方法相比,预测结果并无显著差异,这说明小波分析法可以用于蛋白质结构研究,若与其他方法结合用于结构预测,将会起到更好的作用。  相似文献   

10.
实验对当今主流的3种蛋白质数据训练集进行了研究.目的是为了建立一个新的训练集从而能更准确的把蛋白质的每个氨基酸残基归类为正确的二级结构,例如,α螺旋、β折叠或无规则卷曲.在分析了传统的蛋白质数据训练集的数据结构以及研究了已发表的传统的训练集改良方法之后,独创性的实验设计出改良的496蛋白质数据训练集并且用LIBSVM(Support Vector Machine,支持向量机)来预测蛋白质二级结构,并且获得了最高的SOV预测准确度.LIBSVM是在统计学中应用于分类领域的一种程序,近年来的实验表明它十分适合应用干蛋白质二级结构分类预测领域,并且表现卓越.  相似文献   

11.
Protein structure Quality Assessment(QA) is an essential component in protein structure prediction and analysis. The relationship between protein sequence and structure often serves as a basis for protein structure QA.In this work, we developed a new Hidden Markov Model(HMM) to assess the compatibility of protein sequence and structure for capturing their complex relationship. More specifically, the emission of the HMM consists of protein local structures in angular space, secondary structures, and sequence profiles. This model has two capabilities:(1) encoding local structure of each position by jointly considering sequence and structure information, and(2)assigning a global score to estimate the overall quality of a predicted structure, as well as local scores to assess the quality of specific regions of a structure, which provides useful guidance for targeted structure refinement. We compared the HMM model to state-of-art single structure quality assessment methods OPUSCA, DFIRE, GOAP,and RW in protein structure selection. Computational results showed our new score HMM.Z can achieve better overall selection performance on the benchmark datasets.  相似文献   

12.
为了研究山羊奇异变形杆菌毒力因子,克隆zapA基因和预测推导的蛋白结构.采用PCR方法,对山羊奇异变形杆菌zapA基因进行扩增、克隆及序列测定;利用生物信息学软件预测推导zapA蛋白的信号肽、跨膜区、二级结构及B细胞抗原表位.结果表明:zapA基因长为1 476bp,编码491个氨基酸,与参考株的核苷酸序列同源性为99.59%,氨基酸同源性为99.59%;zapA蛋白存在信号肽,无跨膜区,B细胞表位可能位于69-71,78-84,136-139,197-199,353-356,371-373和472-474氨基酸区域内或附近.该试验为奇异变形杆菌zapA蛋白的表达及基因工程疫苗的研制提供了理论基础.  相似文献   

13.
Prufer码是一种用N-2个自然数的排列来对应一棵N个节点的标号树的编码方式,在现代优化算法中由于便于运算而常常被采用.就标号树直观的边集表示和Prufer码之间的转换算法进行实现和改进,利用简单的数组结构可以在线性时间内实现Prufer的编解码.  相似文献   

14.
SARS冠状病毒N蛋白的表达及二级结构预测分析   总被引:2,自引:1,他引:2  
通过RT-PCR获得SARS冠状病毒N蛋白基因,分别克隆到原核表达载体pET21a,pET32a和pGEX-4T-1中,将3种重组质粒pET2la-N,pET32a-N和pGEX-4T-1-N分别转化大肠杆菌BL21(DE3),经IPTG诱导,细菌中分别表达出约46kD的重组N蛋白、约60kD的6xHis-N融合蛋白和约70kD的GST-N融合蛋白,表达量分别达总蛋白的45%、40%和30%.进一步的分析表明:6xHis-N融合蛋白在大肠杆菌中为可溶性表达,该可溶性组分占细菌裂解液的70%左右,且能被6xHis抗体所识别.用蛋白分析软件对N蛋白进行了序列分析和二级结构预测.SARS冠状病毒N蛋白在大肠杆菌中的高效可溶性表达,有助于进一步结晶后进行X射线晶体衍射分析其结构与功能.  相似文献   

15.
采用PCR技术从一株内生枯草芽孢杆菌HD-1基因组DNA中扩增出β-甘露聚糖酶基因核苷酸编码序列.序列分析表明,该基因全长1 089bp,编码362个氨基酸和一个终止密码子,N端前27个氨基酸为其信号肽.该酶氨基酸序列与相同来源的β-甘露糖苷酶同源性最高达98.34%,具有ManB保守结构域,属于糖苷水解酶家族26的一员.通过对该酶分子三维结构的预测分析,该酶的催化域形成TIM桶状结构,Cys92和Cys112形成二硫键,它们之间的部分构成该酶的氧化还原反应的活性中心,Glu100和Glu292分别为该酶的酸碱催化位点和亲核催化位点.三维结构的分析为提高酶的催化活性的和功能方面的定向改造提供了依据.  相似文献   

16.
马铃薯天冬氨酸蛋白酶抑制剂基因克隆和结构分析   总被引:3,自引:0,他引:3  
以马铃薯基因组DNA为模板并基于天冬氨酸蛋白酶抑制剂基因的cDNA序列所设计的两个引物,通过PCR扩增得到666bp的天冬氨酸蛋白酶抑制剂基因编码区,并将此片段克隆到pUC18的SmaI位点.序列分析结果表明该基因除去末端一终止密码子外其可译框架编码221个氨基酸残基,前导肽包括32个氨基酸残基,故该抑制剂的成熟蛋白由189个氨基酸组成,第67位的精氨酸为抑制胰蛋白酶的活性中心.与cDNA相比核苷酸的同源性为94.3%,氨基酸的同源性为90%.基因DNA无内含子.  相似文献   

17.
The pituitary hormones corticotropin (ACTH) and beta-lipotropin (beta-LPH) are formed from a large common precursor. Recently, we have elucidated the whole primary structure of the bovine ACTH-beta-LPH precursor (designated alternatively as preproopiocortin) by determining the nucleotide sequence of cloned DNA complementary to the mRNA coding for the precursor protein. The amino acid sequence assigned has disclosed a characteristic repetitive structure of the ACTH-beta-LPH precursor. The repetitive units of the precursor protein each contain a melanotropin (MSH) sequence (alpha-, beta- or gamma-MSH) as well as other peptide components such as beta-endorphin and corticotropin-like intermediate lobe peptide (CLIP). The repetitive units as well as their peptide components are each bounded by paired basic amino acid residues, which apparently represent the sites of proteolytic processing. Several studies have confirmed the translational initiation site and protein structure assigned (see also ref. 11 and refs therein). In view of the recent knowledge about the organization of eukaryotic genes (see refs 12, 13 for reviews), it would be of particular interest to investigate the relationship between the repetitive structure of the ACTH-beta-LPH precursor containing different functional components and the arrangement of the protein-coding sequence in its gene. We have now isolated and characterized bovine genomic DNA fragments encoding this precursor protein and have demonstrated that the protein sequence is encoded by two non-consecutive DNA segments. An intron (intervening sequence) of approximately 2.2 kilobase pairs separates the smaller exon (mRNA-coding sequence), which contains the gene sequence encoding the signal peptide, from the larger exon, which contains the gene sequence for most of the protein structure, including the known biologically active component peptides.  相似文献   

18.
为了研究新型冠状病毒膜蛋白(SARS-CoV-2 M蛋白)结构及性质.基于生物信息学分析M蛋白质基因结构、二级结构和三级结构、翻译后的修饰和进化历程.结果表明,M蛋白为疏水性蛋白,其基因编码区长度为669bp,编码222个氨基酸;M蛋白启动子区内不存在甲基化位点,存在17潜在的转录因子结合位点;其二级结构以无规则卷曲和β折叠为主,不含外分泌信号肽,存在3个跨膜结构域、2对二硫键、37个磷酸化位点、1个N连接的糖基化位点和6个B细胞抗原结合位点;进化树分析表明,SARS-CoV-2 M蛋白与蝙蝠冠状病毒的M蛋白具有同源性.此结果为深入研究其结构与功能提供了理论数据,也为疫情防治提供了参考依据.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号