首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 11 毫秒
1.
核小体是染色体的基本结构单元。将核小体序列和非核小体序列预处理为时间序列数据,利用LSTM(long short-term memory network)进行迭代训练和长、短程特征学习,得到的LSTM模型可以实现核小体序列92.67%的识别准确率。研究表明,核小体序列与非核小体序列具有不同的特征,并且核小体序列具有高度可分类性。基于核小体序列的高度可分类性,可以实现核小体序列与非核小体序列的判断识别,这对于核小体定位及其动态性、基因转录调控、DNA复制与修复和DNA序列的功能及进化等的研究具有一定的生物学意义和价值。  相似文献   

2.
基于Brogaard等2012年给出的酵母全基因组单碱基精度的核小体定位图谱,从中提取出酵母基因组全部的核小体中心序列和连接序列.计算k-mer(k取4、5、6和8)在两类序列中的相对频率,分析两类序列中k-mer的使用差异.按照k-mer相对使用频率对数增序的方式排列模体,得到两类序列k-mer相对频率对数比的分布.结果显示模体长度越长两类序列的使用差异越明显,当k>7以后差异分布逐渐稳定.按照中心序列8-mer相对频率增序的方式排列模体,发现在相对频率小于0.5的区域,两类序列的8-mer使用差异显著.分别计算了7个抽样点附近中心序列偏好的8-mer和连接序列偏好的8-mer的G+C含量和二核苷含量.结果显示两类序列模体的G+C含量随着相对频率的增大而逐步减小,中心序列更加偏好GC和CG二核苷,而连接序列更加偏好GG二核苷和CC二核苷.这些主要的差异特征与实验分析结果一致.  相似文献   

3.
基于包含人类基因转录起始位点附近的58989条DNA序列,运用核小体特征量对序列做分类分析,发现±1核小体位于TSS区域两侧的第一类基因约占28%,TSS区域有核小体占据的第二类基因约占30%.用二阶信息冗余特征量分析了DNA序列的碱基关联分布,发现没有占据TSS区域的核小体对应的序列具有强碱基关联,占据TSS区域的核小体对应的序列具有弱碱基关联,弱关联是TSS区域的普适特征.表明占据TSS区域的核小体具有很强的序列适应性和位置的可变性.通常定义的含TSS的核小体缺失区域仅对第一类基因成立.推测第一类基因具有较高的转录效率.  相似文献   

4.
使用多样性增量预测磷酸化位点   总被引:1,自引:0,他引:1  
磷酸化是蛋白质最重要的翻译后修饰之一.应用基于多样性增量的二次判别分析 (Increment of Diversity with Quadratic Discriminant analysis,IDQD)方法对CK2,PKA和PKC三种类型磷酸化位点进行预测,k-fold交叉检验的正确率分别为86%,90%和85%,独立测试集检验的正确率分别为86%,88%和84%.所得结果高于包括支持向量机在内的现有预测方法.  相似文献   

5.
老鼠和人类基因组的同源性超过90%,老鼠基因组的研究为人类基因组序列研究提供了参考数据.统计分析了老鼠盒式外显子和内含子保留型剪接位点附近的序列保守性特征,并据此分别利用基于多样性指标的支持向量机和二次判别法对老鼠基因组中这两种剪接类型的供体端和受体端可变剪接位点进行了预测.独立检验结果表明,盒式外显子和内含子保留型的供体端和受体端可变剪接位点的预测均能达到较高的识别精度.  相似文献   

6.
用4肽结构字预测蛋白质二级结构   总被引:2,自引:0,他引:2  
介绍一种新的方法来预测蛋白质二级结构.该方法是基于4肽结构字的基础上,利用4肽结构字建立多样性源同时结合二次判别法来预测一个序列片段中心残基的二级结构,最后对预测后的结果进行修正.对1645个蛋白进行检验,其21残基片段中心残基,10折交叉检验的结果Q**3(Q3score)达到79.68%.当考虑长程序列信息时,预测将会更精确.与其它预测软件相比较,显示了一定的优势.  相似文献   

7.
通过直接测序的方法获得翘嘴鳜线粒体DNA基因组全序列(GenBank:JF972568).翘嘴鳜线粒体基因组全长为16 496 bp,其包含13个编码蛋白基因、22个tRNA基因、2个rRNA基因和1个Control region区域.整个翘嘴鳜线粒体DNA利用率非常高,仅仅只有32 bp的基因间隔和35 bp的基因重...  相似文献   

8.
全基因组选择是一种用于改良动植物育种群体中数量性状的方法,通过使用覆盖整个基因组的分子标记信息对复杂性状进行预测,从而帮助筛选出更适合培育的亲本.基于长牡蛎的单核苷酸多态性(SNP)位点信息,提出了一种预测长牡蛎肥满度分布参数的全基因组选择的新方法.首先,采用一种基于不同评价准则的二次特征选择方法,挑选与肥满度相关性较高的SNP位点;其次,利用所挑选的SNP位点信息构建具有正则化项的高斯通用加性模型对每个长牡蛎样本肥满度分布参数进行预测;最后,在长牡蛎数据上将所提方法和一些现有方法进行了验证比较.实验结果表明,所提方法具有更好的拟合精度和更低的均方误差,并能对样本性状稳定性进行有效的评估.  相似文献   

9.
【目的】充分了解核桃黑斑病菌的侵染机制。【方法】以全基因组序列已经公布的7个核桃细菌性黑斑病菌菌株CFBP2528、CFBP7179、CFBP8253、DW3F3、J303、NCPPB1447、Xaj417等所具有的蛋白序列为预测数据,基于分泌蛋白所具有的主要特征,利用SignalP v4.1、ProtCompB v9.0、TMHMM v2.0、big-PI Fungal predictor、TargetP v1.1、LipoP v1.0等在线分析程序对分泌蛋白进行预测,同时分析其氨基酸组成及分布、信号肽长度、信号肽切割位点等特征。【结果】核桃细菌性黑斑病菌的分泌蛋白平均为74个,其氨基酸长度多集中于101~400氨基酸,所占比例为63.65%。信号肽氨基酸残基中以A最多,所占比例为22.04%; 其次是L,所占比例为19.27%。信号肽长度以19~29个氨基酸的最多,所占比例为79.62%,信号肽切割位点属于A-X-A类型。【结论】核桃细菌性黑斑病菌中分泌蛋白的有效预测,可为深入解析核桃细菌性黑斑病菌中分泌蛋白在侵染过程中所发挥的功能提供理论依据。  相似文献   

10.
针对发动机状态在线预测中样本累积、预测模型膨胀和在线更新速度慢等问题,提出了基于增量稀疏核极限学习机的在线预测方法.该方法定义了KELM核函数矩阵的稀疏测量矩阵,并根据矩阵原子相干最小化和自信息量最大化的样本信息度量准则实现在线样本前向稀疏与后向删减,提高了样本稀疏化效率.利用有效样本对测量矩阵在最佳阶数内进行在线扩充与修剪,限制了预测模型膨胀.利用改进的增量建模方法对模型的核权重矩阵进行递推更新,从而建立规模有限且结构稀疏的在线预测模型,提高了在线建模速度.仿真数据和发动机状态参数在线预测实验结果表明,与现有在线预测方法相比,ISKELM具有更高的样本稀疏化和在线建模效率.对发动机排气温度进行120步预测时,预测速度分别提高了80.50%和31.72%,预测精度分别提高了48.56%和15.81%.   相似文献   

11.
陈辉  莫兰兰 《科技资讯》2011,(24):156-156,161
针对电压互感器二次回路现场安装、维护采用的方法和遇到的问题,列出了核相的方法和数据,以及零序电压互感器二次回路的接线注意事项,为今年后的工作提高可靠保障。  相似文献   

12.
混沌时间序列的最小二乘支持向量机预测   总被引:4,自引:0,他引:4  
提出了最小二乘支持向量机混沌时间序列预测方法,并研究了三种混沌信号的预测性能。该方法在优化指标中采用了平方项,且只有等式约束,将传统支持向量机求解二次规划问题转化为求解线性方程组,因而简化了计算复杂性。仿真实验结果表明该方法预测模型参数选择容易、在较大范围内取值时对预测误差影响很小,而且即使在输入维数m小于Takens嵌入定理所确定的维数时,也具有很好的预测性能。  相似文献   

13.
为了实现星图中弱小星点目标的检测,提出了一种基于核Rayleigh二次相关滤波器(KRQQCF)的星图自适应杂波抑制方法.采用星图模拟方法随机产生视轴指向,根据二维高斯模型产生训练样本,提取改进的加速鲁棒特征(SURF),通过训练学习构建KRQQCF.为了快速检测目标,对待测图像首先用频域残差法检测星图中星点可能存在的显著性区域,然后提取该显著区域改进的5维SURF特征.最后,通过KRQQCF识别目标,有效抑制杂波及噪声,提高星图的信噪比.实验结果表明,该算法快速、有效、可靠.
  相似文献   

14.
现有结合特征提取与预测模型的方法不能准确把握金融时间序列的混沌性与交互性,导致预测精度不高。针对此问题,提出一种基于二次分解与长短期记忆(long short term memory, LSTM)网络的金融时间序列预测算法。使用变分模态分解方法与集成经验模态分解方法依次解析金融时间序列数据,得到能表达数据混沌性特征的模态;将模态信息输入到融合有因子分解机(factorization machine, FM)的长短期记忆网络模型中,融合获取到的长记忆性特征与交互性特征,进而预测最终的结果;选取沪深300指数的历史数据作为实验数据集,通过多组对比实验验证算法的有效性。实验结果表明,提出的算法可以有效提升模型的预测能力,同时表达金融时间序列的混沌性、长记忆性、交互性。  相似文献   

15.
本文给出了凸二次优化问题基于一类有限核函数的新的大步校正内点算法.这些核函数是一类相当广泛的函数,它的主要特征是非自正则的,而且在其可行域边界上的值是有限的.利用类似于线性规划的相应算法的分析方法,证明了新算法具有目前最好的大步校正算法的迭代复杂性,即O(√nlognlog(n/ε)).  相似文献   

16.
潘豪 《科技资讯》2014,12(22):72-72
本文重点对高压小流量的手动液压泵进行介绍,对其结构原理和特点进行分析,通过双泵供油的双级手动高压泵设计,在柱塞泵和手柄之间添加了铰杆和杠杆串联的二次增力结构,这一结构的使用对液压泵高压工作下的手柄操纵力产生了很好的减小效果,能够实现劳动力的节约,并且在运用中取得的效果较好.  相似文献   

17.
探讨了最小二乘支持向量机时间序列预测的方法,提出了用核主成分分析提取主元,然后用最小二乘支持向量机进行预测.通过实验表明,这种方法得到的效果优于没有特征提取的预测.同时与主成分分析提取特征相比,用核主成分分析效果更好.  相似文献   

18.
本文对凸二次规划提出了一种基于新的核函数的大步校正原始-对偶内点算法.这种核函数构造新的障碍函数不仅可以定义新的搜索方向,而且可以控制内迭代的过程,使得对凸二次规划提出的大步校正原始-对偶内点算法的多项式复杂性阶改善到O(√n(logn)2log(n/ε)),优于基于经典对数障碍函数的相应算法的复杂性阶.  相似文献   

19.
针对大坝变形影响因素的复杂性以及监测数据的非线性、随机波动大和预测难度大等问题,提出一种改进自适应粒子群(particle swarm,PSO)算法的混合核函数最小二乘支持向量机(least squares support vector machine,LSSVM)模型,实现了大坝水平变形的时间序列预测方法.基于Mer...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号