首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
亚细胞位点是蛋白质很重要的功能特征.找到一种有效的、可信度高的预测蛋白质位点的方法是很必要的.提出了一种基于马尔科夫模型的改进预测方法.首先,对于一条给定的蛋白质序列,通过计算在马尔科夫模型下20个氨基酸残基的状态转移矩阵,建立一个420维的特征向量,然后利用支持向量机进行训练和预测,最后夹克刀检验证实了该方法的预测精度与以前的马尔科夫模型相比得到了一定的提高.  相似文献   

2.
在构建小鼠蛋白质亚细胞定位和小鼠跨膜蛋白类型数据库的基础上,利用离散增量结合协变判别函数分别对小鼠蛋白质亚细胞定位和小鼠跨膜蛋白类型进行了预测.对小鼠蛋白质亚细胞定位数据库,Self-consistency检验和Jackknife检验预测成功率分别达到99.0%和75.6%;对小鼠跨膜蛋白类型数据库,Self-consistency检验和Jackknife检验预测成功率分别达到85.6%和77.5%.  相似文献   

3.
蛋白质亚细胞定位是当前生物信息学和蛋白质科学的重要研究领域,本研究从蛋白质一级序列出发,取伪氨基酸组成向量作为输入数据,运用支持向量机作为预测工具,对人类12类蛋白质亚细胞的定位进行预测,得到独立检验的结果为85.2%,Jack knife 检验的结果为80.6%;结果显示,用较简单的预测方法,得到了较好的预测结果.  相似文献   

4.
一种新的蛋白质亚细胞定位预测训练集构造方法   总被引:1,自引:0,他引:1  
设计了一种新的蛋白质亚细胞定位预测训练集构造方法.该方法针对传统预测方法缺乏足够的实验标记数据的问题,基于主动学习策略从非实验标记蛋白质数据中主动选择有效数据,并与原有的实验标记数据共同训练预测模型,以提高基准分类器的预测精度.结合支持向量机分类器,该方法在病毒蛋白质独立测试集上进行了预测实验,测试结果表明,该方法能够有效地提高基准分类器的预测能力,性能优于现有的病毒蛋白质预测系统.  相似文献   

5.
长链非编码RNA(Long non-coding RNA,lncRNA)是指一类长度超过200个核苷酸、没有编码蛋白质的能力或编码蛋白质的能力极低的RNA分子,它与人类生命活动和多种疾病息息相关。有研究表明lncRNA的亚细胞定位可以为其功能研究提供重要的生物学信息。越来越多的实验数据证实,lncRNA具有多个位置标记,而现有算法大多集中在识别单个位置标记的lncRNA上。因此,为了识别lncRNA的亚细胞多定位,引入了k-mer核苷酸组成和序列顺序相关因子作为lncRNA的特征向量,采用方差分析(ANOVA)筛选出最优特征子集,基于支持向量机算法来预测lncRNA的亚细胞多定位问题。通过5折交叉检验对模型进行评估。结果表明,基准数据集和独立数据集的预测位置覆盖率分别达到87.22%和71.56%。  相似文献   

6.
针对蛋白质相互作用(protein-protein interaction,PPI)网络中存在大量噪声,以及现有关键蛋白识别方法的挖掘效率和预测准确率不高等问题,提出一种基于复合物信息和亚细胞定位信息(united protein complexes and subcellular locallizations,PCSL)来识别关键蛋白质。首先,整合PPI网络的拓扑属性、生物属性和空间属性构建加权网络,以降低PPI网络中噪声的影响,达到提升PPI网络的可靠性的目的;其次,根据复合物信息和空间信息,设计一种衡量蛋白质关键性的度量,从多维角度强化关键蛋白质在PPI中的重要程度;最后,利用基于PPI网络拓扑特性的寻优算法,设计一种新的试探策略,提升挖掘关键蛋白质的效率。PCSL方法应用在DIP(database of interacting protein)数据集上进行验证。实验结果表明,与其他10种关键蛋白质识别方法相比较,该方法具有较好的识别性能,能够识别更多的关键蛋白质。  相似文献   

7.
蛋白质亚细胞定位预测研究进展   总被引:1,自引:0,他引:1  
蛋白质的功能与其在细胞中的定位有着密切的联系,新合成的蛋白质必须处于适当的亚细胞位置才能正确的行使其功能.预测蛋白质的亚细胞定位,在确定一个未知蛋白质的功能,了解蛋白质相互作用等方面有着重要的意义.机器学习方法在蛋白质亚细胞定位研究中扮演着一个重要的角色.笔者从数据集的构建、蛋白质序列特征提取方法、蛋白质亚细胞定位预测算法以及预测算法的性能评估等四方面总结了过去十几年间机器学习方法在蛋白质亚细胞定位研究中的应用情况,系统阐述了蛋白质亚细胞定位预测研究的进展.  相似文献   

8.
用离散量方法预测蛋白质亚细胞定位   总被引:2,自引:2,他引:2  
根据蛋白质的亚细胞定位,将蛋白质分为四类,用离散量的数学理论,提出了预测蛋白质的亚细胞定位理论方法,利用蛋白质中氨基酸组分,通过计算离散增量和离散有限系数预测蛋白质的亚细胞定位,用self—consistency和Jackknife两种方法测试均获得较高的预测成功率。结果表明:蛋白质类中包含的蛋白质数越多,预测成功率越高。  相似文献   

9.
蛋白质-DNA相互作用位点在各类生理生化反应中扮演重要角色.本论文旨在构建一种可以准确预测“相互作用位点”的方法:PdDNA,其内容主要包括支持向量机和序列匹配器.支持向量机通过提取相互作用位点中心残基的特征进行训练并分类,序列匹配器则通过蛋白质特征矩阵(PSSM)对氨基酸序列进行相关性评估,对二者结果进行归一化整合,得到最终的预测结果.利用公开数据集PDNA_62,我们的PdDNA预测准确率为86.87%.为进一步验证PdDNA可靠性,我们还自建了PDNA_224数据集,其预测准确率为83.07%,处于较高水平.因此PdDNA是一种有效的“蛋白质-DNA相互作用位点”预测方法.  相似文献   

10.
提出一种基于支持向量机学习蛋白质结构域的边界预测方法. 在分析多序列比对结果的基础上, 定义了几种能够直接或间接反映蛋白质结构属性及结构域信息的新方法. 结果表明, 蛋白质序列信息预测边界信号的正确识别率达85%以上, 具有较好的泛化能力.  相似文献   

11.
基于剪接位点竞争机制,剪接位点对分成竞争性剪接位点对和非竞争性剪接位点对.并且竞争性和非竞争性剪接位点对的分类是一个很重要的工作.结合位置权重矩阵、离散量和支持向量机,提出了预测竞争性和非竞争性剪接位点对的新方法.独立检验集中90%以上的剪接位点对能被正确地分类成竞争性和非竞争性剪接位点对.此预测成功率高于其它方法.  相似文献   

12.
根据革兰氏阴性菌蛋白不同亚细胞位置、其一级结构中氨基酸含量、氨基酸的关联性及亲疏水性的不同,利用最小离散增量的方法,分别以20个氨基酸组份、400个氨基酸二联体组份及氨基酸亲疏水性在蛋白质上的分布为参数构成离散源,对革兰氏阴性菌蛋白的5类亚细胞定位进行预测,分别用self—consistency方法和Jack-knife方法预测,均取得了较高的预测成功率.  相似文献   

13.
Introduction In March 2003, a novel coronavirus (CoV) was dis-covered in association with the outbreak of severe acute respiratory syndrome (SARS)[1-3]. The complete genome sequence of several SARS-CoV isolates was soon determined and characterized[4,5]. Comparison of variant SARS-CoV genome sequences has identified certain genetic signatures that can be used to trace sources of infection[6]. Vaccines are now being devel-oped and molecular modeling has suggested that modi-fied rhinovir…  相似文献   

14.
利用统计学习理论中的支持向量机(SVM),基于氨基酸组分含量预测生物膜蛋白类型。使用文献中2059个训练集和2625个检验集膜蛋白序列数据,运用统计预测中的校准检验,留一法交叉检验和独立数据集检验方法进行分类预测。结果表明,SVM对膜蛋白类型预测具有明显的优越性,该算法对当前已有方法起到重要的补充作用。  相似文献   

15.
Using Hilbert-Huang transform, subcellular localization for prokaryotic and eukaryotic proteins was predicted and tested with Reinhart and Hubbard’s dataset. The prediction accuracy of prokaryotic and eukaryotic protein sequences concentrated in the dataset all reached 100% by self-consistency, 91.8% for the former and 88% for the latter by the five fold cross-validation test. A significant improvement in prediction quality by incorporating the spectrum parameters with the conventional amino acid composition was observed. One of the crucial merits of this approach is that many existing tools in mathematics and engineering can be easily applied in the predicting process. It is anticipated that digital signal processing may serve as a useful vehicle for many other protein science areas.  相似文献   

16.
为了提高无线传感器网络三维节点的定位精度,针对SVM的核函数构建问题,提出一种基于小波支持向量机(WSVM)的定位算法.首先,收集三维传感器锚节点信号强度,构建支持向量机学习样本;然后,将其输入到小波支持向量机进行学习,建立三维传感器节点定位模型;最后,采用仿真实验对模型性能进行测试.研究结果表明:与传统三维定位算法对比,使用小波支持向量机中的三维传感器节点进行定位时,精度水平得到有效提升,获得更加稳定的节点定位结果,可以广泛应用于实际无线传感器网络系统中.  相似文献   

17.
采用支持向量机(SVM)评估老年人步态的对称性.将鉴别老年人下肢左、右两侧的步态模式相似性问题转化为二分类问题,通过识别老年人下肢左、右两侧的步态模式,确定其两侧步态模式相似性的差异,判断其步态的对称性.采集24名健康老年人下肢左、右两侧的步态数据,采用交叉验证方法评估SVM泛化能力,测试了多项式核、径向基核、线性核.结果表明,多项式核、径向基核的泛化能力优于线性核,基于多项式核的SVM识别左、右两侧老年人步态模式的分类正确率较高(88%),可有效地提取步态模式的非线性信息.SVM有望成为评估老年人步态对称性的一个有效的工具,有助于及早预防老年人跌倒和老年性疾病发生,提高老年人生活质量.  相似文献   

18.
在Du和Li构建的首个亚线粒体定位数据库基础上,将线粒体蛋白依据亚线粒体位置细分为四大类进行预测.对基于氨基酸的亲疏水特征、物理化学特征和结构特征的蛋白质序列约化信息做出讨论.给出在单肽组分和六类亲疏水约化情形下的蛋白质序列最佳分割位点,结果不仅符合真实生物学现象而且范围更加精确,可为相关实验研究提供参考.提出了最佳组合参数,该参数是ω=0.10,λ=22时亲疏水残基指数值及平行相关形式的伪氨基酸组分结合全序列单肽组分,利用支持向量机算法进行预测,达到了较好的预测结果.利用本文提出的最佳组合参数对未知蛋白序列进行检验,结果显示有一定注释作用,特别是对于Inner membrane类和Matrix类的预测精度较高.  相似文献   

19.
支持向量机程序SVMProt预测SArs病毒蛋白质的功能   总被引:1,自引:0,他引:1  
对SARS冠状病毒蛋白质功能的有效识剐将有利于促进SARS传染病治疗药物的开发。应用基于支持向量机原理的SVMProt程序识别SARS冠状病毒蛋白质的功能,通过对SARS冠状病毒中2个已知功能的蛋白质功能的成功预测,说明SVMProt能够有效地应用于SARS冠状病毒蛋白质及其他种类蛋白质的功能预测。对SARS冠状病毒中至今仍未知其功能的蛋白质ORFl3的功能进行了预测,结果显示ORFl3是一种可能与DNA结合的核蛋白并兼有病毒体内结构蛋白的功能。  相似文献   

20.
刘国平  姚莉秀  杨杰  王猛 《上海交通大学学报》2005,39(10):1676-1679,1684
针对膜蛋白类型预测中普遍存在的不平衡样本问题,分析一般支持向量机(SVM)在处理不平衡样本时的缺陷,引入加权SVM来补偿由于训练集中的类别差异引起的分类结果偏向于多样本类别的问题.采用统计预测中的一致测试、交叉校验和独立测试方法进行测试.实验表明,不平衡处理后的效果非常理想,该方法可以成为现有方法一个有效的补充分析工具.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号