首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
蛋白质二级结构与蛋白质三级结构及蛋白质功能密切相关,是生物信息学研究的热点,其中概率图模型隐马尔可夫算法(HMM)是该领域研究的重要工具。但是在实际应用中,存在着HMM训练下溢、不同训练集的效果差异较大及参数优化困难等问题。对预测蛋白质二级结构时HMM遇到的训练下溢问题提出了改进方案;首次提出8-状态HMM来预测蛋白质二级结构,并且将参数B改进成为包含状态转移信息的三维参数;为了改进最优HMM模型的确定方法,用每个样本分别对初始HMM模型进行训练,得到一系列新的模型,然后对这些新模型的参数求均值,将求得的均值作为最优模型的参数。这些改进方法提高了HMM预测蛋白质二级结构的准确率,为HMM的进一步优化打下良好的基础。  相似文献   

2.
基于改进BP神经网络预测蛋白质二级结构   总被引:6,自引:0,他引:6  
蛋白质结构预测在生物信息学研究中占有重要地位,而蛋白质二级结构预测是蛋白质结构预测的关键步骤。针对标准BP算法存在的缺点,讨论采用几种不同的改进BP神经网络来实现蛋白质二级结构的预测,运用MATLAB语言实现各种改进算法的初始化和训练。并分析比较了它们对蛋白质二级结构预测精度的影响。实验表明,遗传算法结合动量法与学习率自适应调整策略的BP算法可获得较高的预测精度。  相似文献   

3.
提出一种蛋白质二级结构预测的新方法.该方法首先对数据集中的氨基酸序列利用PSI-BLAST程序进行同源序列搜索,得到相应的PSSM矩阵,然后利用滑动窗口方法对矩阵进行编码,得到分类器的输入.采用分类器集成,将所有的样本划分成9个互斥训练集对单个子分类器进行训练.然后,9个单独的0-1子分类器通过最大投票法进行集成,形成识别一种特定的蛋白质二级结构的0-1分类器.这样3个0-1分类器模型通过串行集成,可以对蛋白质的三种二级结构(H/E/C)进行识别.通过对标准数据集RS126,CB396,CB513进行测试发现,对于同一分类器,利用PSSM矩阵作为分类器输入的预测准确率要高于直接将蛋白质序列作为输入的预测率.  相似文献   

4.
实验对当今主流的3种蛋白质数据训练集进行了研究.目的是为了建立一个新的训练集从而能更准确的把蛋白质的每个氨基酸残基归类为正确的二级结构,例如,α螺旋、β折叠或无规则卷曲.在分析了传统的蛋白质数据训练集的数据结构以及研究了已发表的传统的训练集改良方法之后,独创性的实验设计出改良的496蛋白质数据训练集并且用LIBSVM(Support Vector Machine,支持向量机)来预测蛋白质二级结构,并且获得了最高的SOV预测准确度.LIBSVM是在统计学中应用于分类领域的一种程序,近年来的实验表明它十分适合应用干蛋白质二级结构分类预测领域,并且表现卓越.  相似文献   

5.
蛋白质二级结构预测是三级结构预测的一个非常重要的中间步骤,而折叠子识别和结构类型的准确预测则可以提高二级结构和三级结构预测的准确度.本文从蛋白质的一级序列出发,提出了一种改进的预测算法:以二肽组分、预测的二级结构信息、伪氨基酸组分和位置权重矩阵打分值等特征分别作为参数,输入离散增量算法的单分类器中,通过加权融合单分类器的计算结果,对27类折叠子的结构类型进行了预测,取得了较好的预测结果.  相似文献   

6.
在已知的蛋白质结构研究方法基础上,提出将多分类问题转化成一对多的二分类问题,来预测蛋白质的未知结构.训练多个单分类器进行分类;选用后向传播(Back Propagation, BP)神经网络作为分类预测模型;以伪氨基酸作为网络输入特征;选用Chou提出的蛋白质数据集;实验数据采用全交叉验证(Jackknife).结果表明:此法能够提高蛋白质三级结构预测的准确率.  相似文献   

7.
驾驶疲劳的产生是渐进的动态生成过程,基于隐马尔可夫模型(hidden Markov model,HMM)的相关研究需首先确定模型训练初值,且训练过程易陷入局部最优.基于此,通过在HMM训练过程中引入粒子群优化(particle swarm optimization,PSO)算法对训练过程存在的上述问题进行了改进,并结合驾驶疲劳状态典型数据集对所提出的改进方法和前向后向算法(forward-backward(BW)algorithm)进行了详细对比.实验及分析测试结果表明,所提出的改进方法在驾驶疲劳预测结果准确性和稳定性上都优于BW算法.  相似文献   

8.
提出一种预测蛋白质二级结构的模式识别方法。该法首先对大量已知结构的蛋白质实验数据进行分析,找出鉴别蛋白质不同结构成分的有效信息,即设计分类器,然后实现对未知蛋白质二级结构的预测。用此方法对640个实验样本进行了研究,得到较高的预测精度,表明方法是有效的。还对实验结果进行了分析;讨论了有限样本对分类器性能的影响。  相似文献   

9.
蛋白质的残基相对可溶性表征蛋白质残基在三级结构中与溶剂接触的程度,它反映蛋白质三级结构及功能位点的主要特征。文章通过引入免疫算法中的亲和度和浓度概念,提出了一种改进贝叶斯优化算法,形成了贝叶斯优化算法选择局部残基相对可溶性优化依据。利用改进贝叶斯优化算法对2148条蛋白链进行分类实验,分析了窗宽对结果的影响,计算了三组数据在最佳参数状态下平均预测精度为79.7%。与其它方法相比,从结果来看,改进贝叶斯优化算法具有更好分类预测性能。  相似文献   

10.
为提高蛋白质二级结构预测的精度,提出了一个由5个子网络集成的多模神经网络模型,预测结果由5个子网络综合得到。对于每个子网络采用神经网络分级思想分为二级网络,一级网络采用含进化信息的profile编码蛋白质序列作为输入,二级结构作为输出。二级网络编码一级网络输出结果作为输入,并将蛋白质序列用改进正交编码方式作为另一输入来提高二级网络的预测精度,输出仍为二级结构。采用子网络差异方式进行单独训练,结果表明该方法最终的预测精度达到71.3%,较大提高了蛋白质二级结构的预测精度。  相似文献   

11.
贝叶斯网络图结构的自动学习是机器学习中的一个挑战,针对传统算法学习效率低、难于去除冗余边及确定结构中边的方向等问题,提出了一种基于马尔可夫毯的贝叶斯网络结构学习算法.该算法改进了经典的马尔可夫毯学习算法,使之减少条件独立检验次数,并在后续确定有向结构方面更适应贝叶斯网络结构学习,同时给出了两种有向边方向确定的一般性解决方案,有效提高了学习算法的学习效率.最后建立了基于贝叶斯网络的互联云QoE评价模型,并进行了仿真实验,结果表明改进后的学习算法在预测准确率、学习效率上均优于传统算法.  相似文献   

12.
为提高分类准确率, 解决城市区域社会功能标签分类难的问题, 提出了一种基于不确定抽样选择策略的半监督城市土地功能分类方法。该算法从轨迹数据中提取城市区域的特征向量, 只需对少量区域进行标签, 根据不确定抽样的主动学习选择策略, 从未标注训练样本中选取具有较多信息的数据, 利用半监督学习算法进行标注, 得到新的标注训练样本添加到训练集, 反复迭代后得到分类结果。实验结果表明, 该方法对不同社会功能的城市区域分类准确率可达90. 2%, 与传统方法相比分类准确率高, 减少了大量标注工作, 在少数标签数据上仍有较好的分类效果。  相似文献   

13.
当前的图像特征识别大多采用的是传统的机器学习方法与卷积神经网络方法。传统的机器学习对图像识别的研究,特征提取多是通过人工完成,泛化能力不够强。最早的卷积神经网络也存在诸多缺陷,如硬件要求高,需要的训练样本量大,训练时间长。针对以上问题,提出了一种改进的神经网络模型,在LeNet-5模型的基础上并在保证识别率的情况下,简化网络结构,提高训练速度。将改进的网络结构在MINIST字符库上进行识别实验,分析网络结构在不同参量中的识别能力,并与传统算法进行对比分析。结果表明提出的改进结构在当前识别正确率上,明显高于传统的识别算法,为当前的图像识别提供新的参考。  相似文献   

14.
为了提高赤足足迹人身识别算法的准确率,本文提出了一种基于深度学习的足迹识别算法。由于足底各区域压力的不同导致了赤足足迹各部分包含的信息量存在一定的差异性,为了获取更稳定、区分度更高的特征,采用ResNet50作为基础网络,在特征层进行分块处理。本文基于2000人的赤足足迹库进行训练,利用500人1000幅测试图在3000人的赤足测试库上进行测试。所提出算法的首位识别准确率达到了98.50%,优于常规的ResNet50网络。实验证明,本文提出的基于特征分块的足迹识别算法在赤足足迹识别中获得了很好的识别效果。  相似文献   

15.
基于强化学习,设计了一个面向三维第一人称射击游戏(DOOM)的智能体,该智能体可在游戏环境下移动、射击敌人、收集物品等.本文算法结合深度学习的目标识别算法Faster RCNN与Deep Q-Networks(DQN)算法,可将DQN算法的搜索空间大大减小,从而极大提升本文算法的训练效率.在虚拟游戏平台(ViZDoom)的两个场景下(Defend_the_center和Health_gathering)进行实验,将本文算法与最新的三维射击游戏智能体算法进行比较,结果表明本文算法可以用更少的迭代次数实现更优的训练结果.  相似文献   

16.
为了平衡集成学习中多样性与准确性之间的关系,并提高决策分类器的泛化能力,提出一种基于负相关学习和AdaBoost算法的支持向量机(SVM)集成学习方法.将负相关学习理论融合到AdaBoost-SVM的训练过程中,利用负相关学习理论计算基分类器间的相关性,并根据相关性的值自适应调整基分类器的权重,进而得到加权后的决策分类器.在UCI数据集中进行仿真,结果表明:相较于传统的负相关集成学习算法和AdaBoost-SVM算法,所提出的方法分类准确率更高,泛化能力更好.  相似文献   

17.
提出了一种基于LSTM的钓鱼邮件检测方式.该方式主要由两部分构成:分别为数据扩充部分及模型训练部分.数据扩展部分中,通过KNN与K-means算法扩大训练数据集,保证数据的数量能够满足深度学习算法的需要.在模型训练部分中,通过对数据进行预处理并将其转化为词向量矩阵,最后将转化完词向量通过训练得到LSTM神经网络模型.最终,可以根据训练好的LSTM模型将邮件分为正常邮件以及钓鱼邮件.通过实验对提出的算法进行了评估,实验结果显示提出的算法准确率可以达到95%.   相似文献   

18.
提出了一种多流形局部线性嵌入的流形学习算法,为每个类的流形学习过程设计了一种监督的近邻点选择方法,将流形-流形距离作为度量指标,搜索最优的低维空间.在视频追踪算法中对外部数据库进行图像训练预处理,为人脸检测建立级联分类器,利用均值粒子滤波器结合跟踪校正策略对人脸图像实时跟踪,采用多流形训练的结果从视频流的人脸集中检测出追踪的目标人脸.仿真实验结果表明本算法对不同的数据集均获得了较高的检测率与较高的计算效率.  相似文献   

19.
山区环境中泥石流的孕育受多种因素的影响,为提高泥石流危险性的预测精度,提出一种萤火虫算法(firefly algorithm, FA)优化核极限学习机(kernel based extreme learning machine, KELM)的预测模型。首先,针对数据维度爆炸的问题,通过主成分分析(principal component analysis, PCA)数据降维,使得留有大部分致灾特征信息的因子输入训练模型;然后,使用萤火虫优化算法更新核极限学习机的参数,将四川省北川县监测数据输入优化后的预测模型,并与其他传统机器学习算法进行对比分析,验证该算法的优越性;最后,使用多种指标综合评估模型的预测效果。结果表明,FA-KELM模型能够有效地简化数据结构,提高泥石流危险性预测的准确性,为泥石流灾害预测方面的研究提供参考和借鉴。  相似文献   

20.
介绍了置信规则库转换(BRB-transformation,BRB-T)模型以及运用置信规则库(belief rule base,BRB)推理进行寿命评估的过程.针对当前的置信规则库学习方法还存在依赖初始解、规则条数偏多、系统结构复杂的问题,结合装备贮存寿命评估的BRB-T模型,提出了基于差分进化算法(DE)对该模型的BRB参数进行学习的优化方法.最后,通过某航天设备的失效数据进行了验证.结果表明,该优化方法能够有效地对模型的BRB参数进行优化;并且优化后的模型可以准确地对产品的寿命进行评估.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号