首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
提出一种蛋白质二级结构预测的新方法.该方法首先对数据集中的氨基酸序列利用PSI-BLAST程序进行同源序列搜索,得到相应的PSSM矩阵,然后利用滑动窗口方法对矩阵进行编码,得到分类器的输入.采用分类器集成,将所有的样本划分成9个互斥训练集对单个子分类器进行训练.然后,9个单独的0-1子分类器通过最大投票法进行集成,形成识别一种特定的蛋白质二级结构的0-1分类器.这样3个0-1分类器模型通过串行集成,可以对蛋白质的三种二级结构(H/E/C)进行识别.通过对标准数据集RS126,CB396,CB513进行测试发现,对于同一分类器,利用PSSM矩阵作为分类器输入的预测准确率要高于直接将蛋白质序列作为输入的预测率.  相似文献   

2.
蛋白质二级结构预测是三级结构预测的一个非常重要的中间步骤,而折叠子识别和结构类型的准确预测则可以提高二级结构和三级结构预测的准确度.本文从蛋白质的一级序列出发,提出了一种改进的预测算法:以二肽组分、预测的二级结构信息、伪氨基酸组分和位置权重矩阵打分值等特征分别作为参数,输入离散增量算法的单分类器中,通过加权融合单分类器的计算结果,对27类折叠子的结构类型进行了预测,取得了较好的预测结果.  相似文献   

3.
一种新的蛋白质亚细胞定位预测训练集构造方法   总被引:1,自引:0,他引:1  
设计了一种新的蛋白质亚细胞定位预测训练集构造方法.该方法针对传统预测方法缺乏足够的实验标记数据的问题,基于主动学习策略从非实验标记蛋白质数据中主动选择有效数据,并与原有的实验标记数据共同训练预测模型,以提高基准分类器的预测精度.结合支持向量机分类器,该方法在病毒蛋白质独立测试集上进行了预测实验,测试结果表明,该方法能够有效地提高基准分类器的预测能力,性能优于现有的病毒蛋白质预测系统.  相似文献   

4.
基于小波分析法的蛋白质结构研究   总被引:3,自引:0,他引:3  
用小波的方法预测了一个已知结构蛋白质的二级结构,并把它同互连网蛋白质结构预测服务及其他结构预测软件得到的二级结构进行比较。结果表明:该方法可以较好地确定蛋白质的二级结构且不必进行同源蛋白质序列的联配。在预测未知结构的蛋白质序列方面,该方法与其他方法相比,预测结果并无显著差异,这说明小波分析法可以用于蛋白质结构研究,若与其他方法结合用于结构预测,将会起到更好的作用。  相似文献   

5.
为了提高蛋白质O-糖基化位点的预测准确率,提出了把核主成分分析(KPCA)与支持向量机(SVM)相结合的方法。实验样本用稀疏编码方式编码,窗口长度为21。首先,用核主成分分析提取了样本的核主成分(特征);然后,在特征空间中用改进的支持向量机(ISVM)进行分类(预测)。在使用支持向量机分类时,设置了一个边界系数来减少运算的复杂度。实验结果表明,使用KPCA ISVM的方法预测的效果优于PCA SVM的预测效果。预测准确率为87%。更进一步,用不同长度的样本做实验(w=5,7,9,11,21,31,41,51),使用多数投票法综合各子分类器的优势。结果表明,组合分类器的预测准确率优于子分类器的预测准确率,预测准确率为88%。  相似文献   

6.
针对水稻蛋白质二级结构预测研究,查阅了国家水稻数据中心文献资源,基于国际蛋白质数据库(protein data bank, PDB),选择具有代表性的蛋白质(5XQI)作为样本,应用BP神经网络建模技术,对水稻蛋白质二级结构进行预测研究。结果表明:先用氨基酸描述子量化一级结构,再用主成分分析综合描述子,能简化模型结构,提高模拟预测准确度和运行速度;构建标量型的人工神经网络模型和仿真函数预测式,简捷直观,应用方便;适宜的模型结构为21∶20∶3,即21个输入层节点、20个隐含层神经元、3个输出层神元的BP神经网络模型结构;模型的整体拟合准确度为0.85,H、E、C三种二级结构的拟合准确度分别为0.92、0.79、0.81;整体预测准确度为0.72,三种二级结构的预测准确度分别为0.79、0.65、0.71。基于BP神经网络的水稻蛋白质二级结构预测模型的拟合、预测准确度比以往同类研究高,为水稻蛋白质二级结构预测提供了一种新的研究方法。  相似文献   

7.
基于改进BP神经网络预测蛋白质二级结构   总被引:6,自引:0,他引:6  
蛋白质结构预测在生物信息学研究中占有重要地位,而蛋白质二级结构预测是蛋白质结构预测的关键步骤。针对标准BP算法存在的缺点,讨论采用几种不同的改进BP神经网络来实现蛋白质二级结构的预测,运用MATLAB语言实现各种改进算法的初始化和训练。并分析比较了它们对蛋白质二级结构预测精度的影响。实验表明,遗传算法结合动量法与学习率自适应调整策略的BP算法可获得较高的预测精度。  相似文献   

8.
蛋白质二级结构与蛋白质三级结构及蛋白质功能密切相关,是生物信息学研究的热点,其中概率图模型隐马尔可夫算法(HMM)是该领域研究的重要工具。但是在实际应用中,存在着HMM训练下溢、不同训练集的效果差异较大及参数优化困难等问题。对预测蛋白质二级结构时HMM遇到的训练下溢问题提出了改进方案;首次提出8-状态HMM来预测蛋白质二级结构,并且将参数B改进成为包含状态转移信息的三维参数;为了改进最优HMM模型的确定方法,用每个样本分别对初始HMM模型进行训练,得到一系列新的模型,然后对这些新模型的参数求均值,将求得的均值作为最优模型的参数。这些改进方法提高了HMM预测蛋白质二级结构的准确率,为HMM的进一步优化打下良好的基础。  相似文献   

9.
实验对当今主流的3种蛋白质数据训练集进行了研究.目的是为了建立一个新的训练集从而能更准确的把蛋白质的每个氨基酸残基归类为正确的二级结构,例如,α螺旋、β折叠或无规则卷曲.在分析了传统的蛋白质数据训练集的数据结构以及研究了已发表的传统的训练集改良方法之后,独创性的实验设计出改良的496蛋白质数据训练集并且用LIBSVM(Support Vector Machine,支持向量机)来预测蛋白质二级结构,并且获得了最高的SOV预测准确度.LIBSVM是在统计学中应用于分类领域的一种程序,近年来的实验表明它十分适合应用干蛋白质二级结构分类预测领域,并且表现卓越.  相似文献   

10.
蛋白质二级结构预测中的简化编码技术   总被引:2,自引:0,他引:2  
神经网络用于蛋白质二级结构预测时,通常氨基酸序列采用正交二进制编码。基于不同残基间的物理化学性质,提出了简化的编码技术,并与其他蛋白质二级结构预测的方法进行了比较。实施结果表明:这种方法更充分地利用了蛋白质一级结构的信息,有较好的效果。  相似文献   

11.
通过介绍分形原理和方法在蛋白质分子结构分析中的应用,表明用分形的方法不仅可以对蛋白质分子结构的复杂性给予定量地描述,而且为人们进一步认识蛋白质的性质和特征提供一些有益的启示和新的信息。  相似文献   

12.
彭志红  Chen  Jie  Lin  Xiwen  Sang  Yanchao 《高技术通讯(英文版)》2007,13(4):431-435
Because it is hard to search similar structure for low similarity unknown structure proteins dimefly from the Protein Data Bank(PDB)database,3D-structure is modeled in this paper for secondary structure regular fragments(α-Helices,β-Strands)of such proteins by the protein secondary structure prediction software,the Basic Local Alignment Search Tool(BLAST)and the side chain construction software SCWRL3.First.the protein secondary structure prediction software is adopted to extract secondary structure fragments from the unknown structure proteins.Then.regular fragments are regulated by BLAST based on comparative modeling,providing main chain configurations.Finally,SCWRL3 is applied to assemble side chains for regular fragments,so that 3D-structure of regular fragments of low similarity un known structure protein is obtained.Regular fragments of several neurotoxins ale used for test.Simulation results show that the prediction errors are less than 0.06nm for regular fragments less than 10 amino acids,implying the simpleness and effectiveness of the proposed method.  相似文献   

13.
蛋白质结构与功能间关系的一个重要方面是蛋白质与配体的识别和结合能力问题.本文通过探寻与同一个配体(HEM)相作用的74个非同源蛋白质上活性位点的潜在规律来分析蛋白质的结构,综合应用编程、数据处理及图像分析等手段对蛋白质及配体的叠合进行研究,为用3D-QSAR方法研究蛋白质的结构提供了可能.  相似文献   

14.
冻藏对面筋蛋白二级结构的影响   总被引:2,自引:0,他引:2  
采用圆二色谱法表征了不同冻藏模式和冻藏时间对小麦面筋蛋白二级结构的影响.结果表明:在SDS溶液中,未经冻藏的面筋蛋白二级结构主要由β折叠和无规则卷曲组成;当冻藏时间小于60天时,两种冻藏模式对小麦面筋蛋白的二级结构影响不大;恒温冻藏模式中面筋蛋白二级结构在冻藏90天时变化最显著,易溶部分中α螺旋转化为β折叠和β转角,难溶部分中β折叠和β转角转化为α螺旋和无规则卷曲;冻融冻藏模式中面筋蛋白二级结构在冻藏60天时变化最显著,易溶部分中α螺旋转化为β折叠和无规则卷曲,难溶部分中β折叠和β转角转化为α螺旋和无规则卷曲.这说明,在恒温冻藏模式下,只有当冻藏时间达到或超过90天的时候,才对面筋蛋白的二级结构产生影响,而在冻融模式下,冻藏时间仅为60天时便可对面筋蛋白的二级结构产生影响.  相似文献   

15.
Nuclear pore complexes (NPCs) are proteinaceous assemblies of approximately 50 MDa that selectively transport cargoes across the nuclear envelope. To determine the molecular architecture of the yeast NPC, we collected a diverse set of biophysical and proteomic data, and developed a method for using these data to localize the NPC's 456 constituent proteins (see the accompanying paper). Our structure reveals that half of the NPC is made up of a core scaffold, which is structurally analogous to vesicle-coating complexes. This scaffold forms an interlaced network that coats the entire curved surface of the nuclear envelope membrane within which the NPC is embedded. The selective barrier for transport is formed by large numbers of proteins with disordered regions that line the inner face of the scaffold. The NPC consists of only a few structural modules that resemble each other in terms of the configuration of their homologous constituents, the most striking of these being a 16-fold repetition of 'columns'. These findings provide clues to the evolutionary origins of the NPC.  相似文献   

16.
蛋白质拓扑结构预测的进一步讨论   总被引:5,自引:4,他引:1  
利用信息论方法,找到了与蛋白质拓扑结构相关性较好的一些二级结构参数,确定了预测蛋白质拓扑结构的最佳参数、对α类,β类,α/β类蛋白制定了简洁的预测规则;对结果进行了讨论。  相似文献   

17.
本文采用有机溶剂热法合成了量子效率高的油溶性CdSe QDs(quantum dots),利用自制的水溶性生物相容性良好的两性PAA-DSPE(聚丙烯酸-1,2-二硬脂酰-sn-丙三醇-3-磷脂酰乙醇胺)低分子聚合物对其表面进行修饰,得到稳定性高、水溶性良好的半导体纳米荧光标记物,并对其进行了TEM,紫外-可见光吸收光谱和荧光光谱的表征。还利用制备的水溶性QDs对NFkB蛋白及其抗体蛋白进行标记,利用荧光显微镜对标记后的结构进行观察,探索标记后量子点对蛋白免疫结合性质的影响。实验结果表明,CdSe/PAA-DSPE的标记对抗原、抗体蛋白的免疫性质未产生明显的影响。  相似文献   

18.
关键蛋白质的识别有助于了解细胞存活的基本需求,并为疾病治疗找到新方法,但是蛋白质自身携带着复杂的生物特性,仅依赖网络拓扑特性不能精准地判断其关键性.因此,提出一种新方法来提高识别关键蛋白质的准确率.首先,考虑网络拓扑特性以及蛋白质在不同亚细胞中的重要程度,定义了SNC方法;其次,利用蛋白质在亚细胞与复合物信息中的特性定义了SIDC方法;最后,通过融合网络拓扑结构和多源生物信息,提出了关键蛋白质识别算法CTB.在YDIP、YMIPS和Krogan数据集上利用精准率-查全率等多种评估方法进行实验,结果表明CTB算法提高了识别关键蛋白质的性能.  相似文献   

19.
 糖链组成的高度多样化及组成单元本身的相似性,使得糖类化合物的分离纯化面临很大的困难,进而导致糖分子结构在很大程度上落后于蛋白质和核酸的结构研究。本论文将DOSY(diffusion ordered spectroscopy,扩散排序谱)应用于由D 葡萄糖和β 环糊精组成的混合物分析研究。结果表明该方法具有良好的结构分析效果,可以很好地研究混合物中单一组分的成分确定及结构表征,作为一种“NMR 色谱”技术具有良好的应用前景。  相似文献   

20.
G蛋白信号转导调节因子(Regulator of Gprotein signaling,RGS)是G蛋白的信号转导系统的负性调节因子,大部分RGS蛋白通过GTP酶激活蛋白方式发挥作用.本文概述了G蛋白信号转导调节因子的结构、功能、意义及国际最新的研究趋势.对RGS的深入研究有利于对信号转导调节的了解.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号