首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 687 毫秒
1.
由蛋白质序列预测蛋白质功能位点对于理解蛋白质功能具有重大的意义,它同时也为生物学实验提供了重要依据.长期以来,基于知识库的方法一直是预测蛋白质功能位点的可靠方法.通过适当修改蛋白质结构分类库SCOP构建了一个附带功能注释的结构域模版库(fDPD),其中每个模版都包含一组序列和结构都非常相近的已知的蛋白质成员.fDPD通过隐马尔可夫模型方法HMMER由未知蛋白质的序列预测其功能位点.为了考察本方法的效果我们检测了两个通用的酶催化位点数据库,一个由约1 500个序列构成的钙离子结合蛋白数据库和从CASP9中提取出的数条蛋白质序列.我们的方法对于配体结合位点以及钙结合位点的预测取得了较高的精度和覆盖率,其催化位点的预测效果仅次于目前已知的最好的方法.我们的计算结果表明,结构上相似的蛋白质其功能位点倾向于出现在蛋白质表面上相似的位置.  相似文献   

2.
基于隐马尔科夫模型的基因预测算法   总被引:1,自引:0,他引:1  
为更好地从DNA序列中识别蛋白质编码区,提高计算效率,将隐马尔科夫模型与前向算法相结合,提出一种生物基因的预测算法.理论证明,该隐马尔科夫模型与经过EM算法优化后的模型具有相同的参数,能够降低计算量,提高计算效率.利用该方法对DNA序列F56F11.4a的外显子进行识别的仿真结果表明,该算法是有效的.  相似文献   

3.
赖氨酸乙酰化(Lysine acetylation,Kace)普遍存在于人体代谢酶中,与多种代谢疾病密切相关,因此准确识别该位点对于代谢疾病治疗的研究具有重要意义.现有的Kace位点预测方法大多采用蛋白质序列层面的信息作为输入,蛋白质结构特性考虑不全面;特征提取时未关注氨基酸残基间顺序相关性,信息丢失严重,降低了预测准确度.提出一种新的Kace位点预测深度学习CL-Kace模型. CL-Kace引入蛋白质结构特性,并与蛋白质原始序列、氨基酸理化属性共同构建位点特征空间,采用卷积神经网络(Convolutional Neural Network,CNN)提取特征;引入双向长短期记忆(Bidirectional Long Short-Term Memory,BiLSTM)网络捕获残基间的顺序依赖关系,以提高网络的抽象能力,识别潜在的Kace位点.实验结果表明,CL-Kace模型优于现有的Kace位点预测器,能够有效地预测潜在的位点.  相似文献   

4.
为了提升蛋白质信号肽及其切割位点预测精度,有效区分3种不同类型的信号肽,提出基于位置特异性打分矩阵(PSSM)和同源检测迭代的隐马尔科夫(HMM)文件的深度学习预测方法。设计基于自注意力机制的神经网络模型用于信号肽预测,并使用基于知识迁移的模型集成方法提升预测效果。设计基于门控循环单元(GRU)网络的条件随机场(CRF)来预测信号肽切割位点,并集成领域规则方法提升预测能力。实验结果表明,该文方法对革兰氏阴性菌和革兰氏阳性菌的Sec/SPI、Sec/SPII与Tat/SPI信号肽预测任务的平均马修斯相关系数(MCC)为0.962。该文方法对革兰氏阴性菌和革兰氏阳性菌的Sec/SPI、Sec/SPII与Tat/SPI信号肽切割位点预测任务的平均召回率和准确率分别为0.698和0.662。在部分信号肽样本上,该文方法能正确预测SignalP 5.0方法预测错误的样本,2种方法在切割位点的预测上存在着一定的互补性。  相似文献   

5.
蛋白质相互作用位点的预测对于突变设计和蛋白质相互作用网络的重构都是至关重要的.由于实验确定的蛋白质复合物和蛋白质配体复合物的结构依然相当少,预测蛋白质相互作用位点的计算方法就显得十分重要.该文提出了一种以支持向量机为分类器,以邻近残基的序列剖面和可及表面积为输入数据来预测蛋白质相互作用位点的方法.计算结果显示,界面残基和非界面残基被识别的准确率为75.12%,假阳性率为28.04%.与输入数据仅有序列剖面的方法相比,界面残基和非界面残基被识别的准确率提高了4.34%,假阳性率降低了4.63%.  相似文献   

6.
Web上的信息量正以惊人的速度增加,人们迫切需要能自动地从Web上发现、抽取和过滤信息的工具,即如何从数以亿计的页面中发现需要的内容、如何从大量的访问中发现固有的模式和关联.马尔科夫模型的网页浏览预测,仅仅从用户的浏览网页本身出发,预测用户的下一步链接,并不能捕获到用户的真正兴趣.本文提出基于隐马尔科夫模型的网页浏览路径预测,并将其与基于马尔科夫模型的方法进行对比.根据已知的浏览序列判断用户的类别,当浏览序列长度很短时,本文方法的预测准确性比马尔科夫模型低.这是由于序列长度过短,系统获取判断的信息少,增加了对用户错误分类的可能性.随着浏览序列长度逐渐增加.系统捕获的用户浏览信息越来越多,进而能够折射出用户的兴趣所在.预测准确率也逐步增加.当浏览序列长度大于或等于8时,预测准确率已经到达80%.提高了浏览兴趣预测的准确率.  相似文献   

7.
基于马尔科夫链的滨海新区第三产业结构研究   总被引:1,自引:0,他引:1  
马尔科夫链主要用于分析随机事件未来发展变化的趋势,是一种比较科学的预测方法.建立了第三产业结构的马尔科夫模型,求出了滨海新区第三产业的稳态结构分布.针对模型的结果以及与浦东新区的对比,得出了若干结论和建议.研究结果对优化滨海新区第三产业结构具有借鉴意义.  相似文献   

8.
蛋白质-DNA相互作用位点在各类生理生化反应中扮演重要角色.本论文旨在构建一种可以准确预测“相互作用位点”的方法:PdDNA,其内容主要包括支持向量机和序列匹配器.支持向量机通过提取相互作用位点中心残基的特征进行训练并分类,序列匹配器则通过蛋白质特征矩阵(PSSM)对氨基酸序列进行相关性评估,对二者结果进行归一化整合,得到最终的预测结果.利用公开数据集PDNA_62,我们的PdDNA预测准确率为86.87%.为进一步验证PdDNA可靠性,我们还自建了PDNA_224数据集,其预测准确率为83.07%,处于较高水平.因此PdDNA是一种有效的“蛋白质-DNA相互作用位点”预测方法.  相似文献   

9.
为了找到一种能够精确有效地预测桥梁运营状况的方法,提出一种基于灰色GM(1,1)理论模型并用马尔科夫链修正的灰色-马尔科夫预测模型.结合河北省某地区的159座桥梁数据对该方法进行应用检验,结果表明:灰色-马尔科夫模型预测数据的平均相对误差为-0.11%,相比灰色GM(1,1)理论模型预测数据的平均相对误差-0.34%,在精度上有了明显的提高,而且灰色-马尔科夫模型预测出的数据更加稳定.利用马尔科夫链优化过的灰色GM(1,1)理论模型预测出2017年至2019年该地区一类桥的数量分别为49座、39座以及34座.由此可知灰色-马尔科夫模型在已知的桥梁定期检查数据基础上可以提供较为精确的预测,相较于灰色GM(1,1)预测模型,该方法具有更高的精度和稳定性.  相似文献   

10.
建立马尔科夫—灰色BP神经网络组合模型是为了更加科学合理预测深基坑压顶水平位移,提高预测精度.比较分析BP神经网络模型与串联式灰色BP模型的预测结果,建立马尔科夫链修正的灰色BP组合模型,以汕头市某花园酒店扩建工程的基坑压顶水平位移的实测数据为研究对象,通过比较模型预测结果与实际结果,检验其深基坑预测模型的精度.实例证明,经马尔科夫链改进的灰色BP神经网络组合模型的预测精度优于单一模型,更适合用于样本少、随机波动性大的深基坑变形预测.马尔科夫—灰色BP神经网络组合模型对深基坑压顶水平位移的预测不仅精度高,同时反映出数据序列发展变化的总体趋势和系统之间各状态的规律,为深基坑压顶水平位移预测提供了一种新方法.  相似文献   

11.
给出了高阶多元Markov链联合稳定分布向量的几个扰动界:结合高阶多元Markov链概率转移矩阵左、右特征向量的相关性质, 得到高阶多元Markov链联合稳定分布向量的扰动界, 新的扰动界结果是一阶多元Markov链联合稳定分布向量扰动界结果的推广;利用高阶多元Markov链概率转移矩阵的特殊性, 给出其联合稳定分布向量可计算形式的扰动界, 也是已有一阶多元Markov 链联合稳定分布向量相应扰动界结果的推广;结合Paz不等式, 通过分析高阶多元Markov链联合稳定分布向量的分量扰动, 得到了联合稳定分布向量基于分量形式的扰动界, 便于观察高阶多元Markov 链中具体某条链某个状态的扰动.  相似文献   

12.
基于光流及耦合隐马尔可夫模型的动态手势识别   总被引:2,自引:0,他引:2  
基于块的相关算法来计算光流,并利用光流跟踪双手的运动.双手的运动轨迹取相邻两点的速度向量,经8方向链码量化后作为观察向量.和直接利用位置信息相比较,提高了识别的鲁棒性.采用耦合隐马尔可夫模型来识别双手动态手势,提出并实现了最大后验概率的训练.对6个双手动态手势的试验表明,耦合隐马尔可夫模型(CHMM)比常规隐马尔可夫模型(HMM)能更有效地对双手动态手势建模.  相似文献   

13.
在传统马氏单元决策过程(MDP)模型中引入多元行动来确定系统的状态转移概率,通过运用传统MDP的基本理论以及结合多元行动集、决策向量、相合度等新定义,提出了马氏向量决策过程模型.  相似文献   

14.
介绍了用有限态文法引导的基于连续密度隐马尔可夫模型(HMM)的连续汉语语音识别系统.分析了系统的组成,词语的HMM的训练方法和对识别系统的测试结果。实验表明,用有限态文法辅助进行连续语音识别是一种有效的策略;连续密度HMM与基于矢量量化的HMM/VQ相比需要较大的计算量,但可明显提高识别准确率。  相似文献   

15.
提出一种蛋白质亚细胞定位预测方法.该方法以位置特异性得分矩阵和基因本体抽取对应特征,结合支持向量机构建多标签分类模型.充分考虑了蛋白质进化信息对其亚细胞定位的影响,并基于文本分类中涉及到的卡方检验的对数变换思想,构建基因本体注释信息的加权系数对其进行加权处理,从而提高预测的准确率.采用支持向量机作为基分类器构建多标签分类模型,进一步提高预测的准确率.通过在目前该领域两个常用的真实数据集上进行的一系列测试结果表明,该方法能有效提高蛋白质亚细胞定位预测的准确率.  相似文献   

16.
An English speech recognition system was implemented on a chip,called speech system-on-chip (SoC).The SoC included an application specific integrated circuit with a vector accelerator to improve performance.The sub-word model based on a continuous density hidden Markov model recognition algorithm ran on a very cheap speech chip.The algorithm was a two-stage fixed-width beam-search baseline system with a variable beam-width pruning strategy and a frame-synchronous word-level pruning strategy to significantly reduce the recognition time.Tests show that this method reduces the recognition time nearly 6 fold and the memory size nearly 2 fold compared to the original system,with less than 1% accuracy degradation for a 600 word recognition task and recognition accuracy rate of about 98%.  相似文献   

17.
使用绿色荧光蛋白作为报告基因来研究目的蛋白的亚细胞定位得到广泛应用.使用稳定表达系统研究蛋白的亚细胞定位比较耗时,但可以先选择愈伤组织进行观察以确保构建的载体能够表达.优化了愈伤组织的培养条件,得到了质地疏松柔软的白色愈伤,不受叶绿体的荧光干扰,便于进行荧光观察.  相似文献   

18.
统计语音合成使用隐Markov模型(HMM)作为声学特征的统计模型。提出了一种利用声学模型空间距离进行HMM的大尺度压缩的量化方法,通过对矢量量化码本进行的优选迭代步骤,减小压缩后的声道谱模型与原模型之间的声学距离,使通过量化模型合成的语音更加接近未量化模型。主观和客观测试结果显示:使用该方法进行声道谱模型的压缩,在压缩至原模型大小的0.06左右时,仍有约90%的评价得分认为合成语音的质量没有明显下降。  相似文献   

19.
Subcellular localization is an important feature of proteins which is closely correlated to their function. In this work,we tried to develop a new coding method of using those location predictive molecular function terms of protein as the input for the prediction of subcellular localization. Combined with the amino acid pair composition of the sequence,this coding system is proved to be efficient for support vector machine (SVM) and to have satisfied performance when tested on the RH dataset. Meanwhile,the model also shows robustness against N-terminal uncertainties in sequences.  相似文献   

20.
为了解决静态资源调度所导致的CPU利用率不高的问题,研究了多目标约束的虚拟资源动态调度方法。给出了云计算虚拟资源调度模型,设计了多目标约束的虚拟资源表示方法,采用马尔科夫链对虚拟资源的下一时刻状态进行预测,从而得到可用资源向量;最后,计算任务与可用资源向量之间的匹配向量,将任务分配给匹配向量中具有最大各维分量之和的虚拟资源进行调度,并提出了具体的采用基于马尔科夫链预测的云计算虚拟资源动态调度算法。实验结果表明:该算法能有效解决云环境下多目标约束的虚拟资源动态调度问题,具有较小的负载均衡离差和任务执行跨度,较其它方法具有较大的优越性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号