首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 709 毫秒
1.
为了解决真核生物启动子调控元件注释难题,以短柄草为研究对象,进行全基因组范围内的核心启动子模体预测.基于系统进化足迹技术,集成多种模体发现算法寻找启动子模体,并结合模体聚类算法筛选出真实模体.结果发现,在前10个最优的核心启动子模体中,有6个与已知的拟南芥模体一致,表明该方法的有效性.  相似文献   

2.
由于风力发电功率预测的准确性直接关系到电网的供需平衡,直接影响着并网系统的运营成本,因此风电功率预测的准确性非常重要。对于预测精度不高的问题,提出了一种改进的果蝇算法优化的支持向量机的预测方法。由于支持向量机的惩罚因子和核函数参数选择对预测精度有很大影响,因而利用改进的果蝇算法对支持向量机参数进行优化,用优化好的参数进行建模训练,然后把建好的模型应用于功率预测,最后对数据进行评估。预测结果表明:改进的果蝇算法优化的支持向量机对风力发电功率预测有更好的准确性。  相似文献   

3.
转录因子结合位点的识别是阐明基因转录调控机制的重要环节,准确的转录因子结合位点的预测算法将有助于人们识别转录因子的目标基因,进而研究转录因子结合位点在上游调控区中的位置对转录调控的影响.然而,目前存在的预测转录因子结合位点的算法所得结果的特异性普遍较低,因此有必要提出一种新的有效的预测转录因子结合位点的算法.本文利用JASPAR数据库上的数据,在深入分析转录因子结合位点生物学特征的基础上,构建了考虑位点保守性和伪计数的位置关联性打分方程,并对果蝇转录因子结合位点进行预测,预测结果的假阳率均低于0.02%.  相似文献   

4.
针对目前实验方法识别天然无序蛋白质中的功能模体耗时费力、难度大,而传统计算机辅助识别方法过于依赖人工挑选特征且准确度低等问题,提出一种利用深度卷积神经网络预测功能模体位置的方法;该方法直接将蛋白质序列作为输入,通过计算对应的位置特异性打分矩阵和3组氨基酸指数特征,将序列映射到数值矩阵中,模型自行抽取特征并自动识别功能模体的隐性序列模式来进行预测。结果表明:当使用相同数据集进行训练和测试时,本文中提出的方法的性能明显优于其他传统的识别算法,在验证集上的感受性曲线下的面积(AUC)值达到0.708,在测试集上的AUC值达到0.760,说明深度卷积神经网络能够有效地识别功能模体的隐性序列模式;该方法也可以用于其他聚集型蛋白质功能位点的识别。  相似文献   

5.
K-means算法普遍应用在数据聚类分析,然而K-means算法具有不稳定性等缺陷,缺乏有效的降维能力,面对大量高维体检数据时聚类效果不佳.针对该问题,文中提出了一种基于FOA与Autoencoder的聚类改进算法,将K-means算法和Autoencoder模型结合,使用Antoencoder进行数据降维,并采用变步长果蝇优化算法的变减步长策略对Autoencoder的权重和偏移初始化方法进行改进.该算法可提高对健康体检数据聚类分析的准确度和效率,聚类轮廓系数也大幅提升,该算法应用于居民健康状况分析、疾病预测等方面表现出了较高的效率.  相似文献   

6.
首先基于频率分析方法抽提出果蝇核糖体蛋白(RP)基因外显子上游直至第1个内含子结束的序列(称为启动子)中潜在的调控模体,这些模体中有85%与实验上的转录因子匹配.然后将抽提出的模体两两配对,运用超几何分布找出出现条数比例在RP基因中显著高于在背景启动子中的模体对,并进一步用K-S检验提取出它们在RP基因中的距离分布与背景距离分布有显著差异的模体对,这些模体对被认为具有转录协同作用.它们中的一部分与实验结果匹配.分析提取出的模体对在序列中的位置分布,发现它们主要的协同作用区域是上游区,而上游和内含子之间的协同作用也是一种重要的组合调控形式,同时发现模体对的模体间距离大部分位于300bp以内,并且在第一外显子附近较为集中.这些结果将有助于对RP基因转录调控机制的认识.  相似文献   

7.
研究了Markov模型在预测基因组合调控模式中的应用.首先基于基因序列特点构造Markov模型,并发展了预测基因组合调控模块的概率模型.然后结合目前基因组合调控模式数据库的特征,提出了比较模型优劣的新指标:丰度.最后利用提出的模型预测分析酵母核糖体蛋白基因中的转录调控模块,并与其它方法进行比较,结果表明Markov模型在预测基因组合调控模式时的有效性和优越性.  相似文献   

8.
针对高光谱图像波段数目多,存储空间大,为后续研究带来极大不便的特点,提出了一种基于广义回归神经网络预测与矢量量化算法结合的高光谱图像压缩算法。该算法通过预测前一波段的像素数据,将符合要求的预测结果继续预测下一波段,通过设置合理的参数,在预测步骤中95%以上的波段可通过预测结果来预测波段数据。利用矢量量化算法对预测数据进行压缩。该算法只需要已知图像的前2个波段数据,即可预测整个图像波段的数据。广义回归神经网络具有很强的非线性映射能力和学习速度,预测效果好。通过预测得到的数据在不同的压缩比下进行实验,结果表明,在保证图像质量的前提下,该算法与对比算法相比,有效降低了运算复杂度,节约了时间,提高了峰值信噪比。  相似文献   

9.
为了提高交通流预测精度,提出了一种基于果蝇算法的混合小波神经网络模型.首先,选择果蝇优化算法对小波神经网络的初始参数进行调节,解决了小波神经网络预测对初始参数敏感的问题.其次,将迭代次数和当前解的情况作为搜索半径和种群规模的动态调整因子,对果蝇算法进行了改进,提高了果蝇算法的全局寻优能力和局部收敛速度.最后,鉴于小波神经网络预测误差存在一定的规律性,使用误差补偿法将调参后的小波神经网络与其他模型进行组合,进行二次误差提取.实验证明,所有混合模型均提高了交通流预测的准确度,其中,与随机森林模型的结合预测精度最高.  相似文献   

10.
目的 提出一种利用共有基因模块构建大规模基因调控网络算法(Common Gene Mod-ules Network,CGMN),有效降低传统基因调控网络构建基因节点规模较大的基因调控网络(包含几百个,甚至几千个基因节点)时时间复杂度过大的缺陷.方法 CGMN算法从基因表达数据出发,采用6种常用聚类算法把基因表达模式相似的基因聚类成功能模块,找出6种聚类方法的共有模块,并将其作为功能模块基因节点,采用局部贝叶斯网络(Local Bayesian Network,LBN)算法构建功能模块基因-基因调控网络.结果 与结论 大规模细胞周期基因表达数据集上仿真实验结果表明,搜索共有模块压缩基因节点数目策略,能够有效降低大规模基因调控网络重构时间复杂度,且验证了CGMN算法构建大规模基因调控网络的有效性.  相似文献   

11.
基于自适应最优模糊逻辑系统的移动通信话务预测   总被引:4,自引:0,他引:4  
移动通信话务数据具有强非线性,传统的预测技术很难准确预测其变化规律.文中根据移动通信话务量的特点,对移动通信话务数据进行分块建模——采用最近邻模糊聚类算法对周期分量模块进行建模,采用线性回归方法对趋势分量模块进行建模,并据此设计了一种智能型的自适应最优模糊逻辑话务预测系统,进而对广东某地区的话务数据进行了预测.现场调试结果表明,该预测系统能有效预测移动通信的话务量.  相似文献   

12.
针对不确定环境的规划问题,提出了基于预测状态表示的Q学习算法.将预测状态表示方法与Q学习算法结合,用预测状态表示的预测向量作为Q学习算法的状态表示,使得到的状态具有马尔可夫特性,满足强化学习任务的要求,进而用Q学习算法学习智能体的最优策略,可解决不确定环境下的规划问题.仿真结果表明,在发现智能体的最优近似策略时,算法需要的学习周期数与假定环境状态已知情况下需要的学习周期数大致相同.  相似文献   

13.
提出一种采用递归神经网络模型构建基因调控网络,将结构训练与参数训练相结合的方法进行网络的权值训练.采用模拟退火算法训练网络结构,找出调控关系权值,再引入基于免疫思想的粒子群算法对权值进行参数优化,得到基因调控网络图.并分别用人工数据和大肠杆茵DNA修复系统基因数据进行实验.实验结果表明,该方法能有效地从基因时序数据中揭示基因间的调控关系.  相似文献   

14.
为了有效度量2个模体的相似度,提出一种带有信息容量的用于模体比较的非比对度量算法ICBSN.该算法通过将一个模体的位置频率矩阵在另一个模体的带有信息容量的位置赋权矩阵上滑动,计算出2个模体间的相似度,算法依赖参数少,计算效率高.与其他7种度量法进行比较分析,结果表明:ICBSM可以在数据库查找中更准确地匹配模体,并且能够更有效地聚类相似模体,区分出不相关的模体,为找回模体和分组密切相关模体等方面的研究工作提供有效的计算工具.  相似文献   

15.
针对研究区山13亚段,提出基于地理信息系统(ArcGIS 10.2平台),利用地质统计分析模块数据分析功能和克里金插值的砂体厚度预测方法.建立地质统计分析模块与砂体厚度数据库的空间连接,利用该模块进行砂体厚度数据探索性分析和基于半变异函数砂体厚度空间相关性分析,明确砂体在平面上的分布趋势,确定平行物源方向为克里金插值的优选方向,采用简单克里金指数模型进行砂体厚度插值,得到研究区山13亚段砂体预测图,其地质吻合度达到75%,可为鄂尔多斯盆地及其他含油气盆地的岩性气藏砂体预测提供借鉴.  相似文献   

16.
突如其来的新型冠状病毒肺炎(COVID-19)疫情给电力负荷造成了严重的影响,为了有效应对疫情带来的影响,提高疫情影响下的短期负荷预测精度,提出了一种基于恐惧指数(FI)的疫情影响下短期电力负荷预测方法.利用疫情数据构建FI,与时间信息、历史负荷、气象条件一起作为广义回归神经网络(GRNN)模型的输入变量,用果蝇优化算法(FOA)对GRNN平滑因子进行优化,提高预测结果的准确度和稳定性,使用构建的预测模型进行预测.算例结果表明,该方法能有效提高疫情影响下短期负荷预测的精度,为重大灾难影响下的短期负荷预测提供参考与借鉴.   相似文献   

17.
传统的数据分析方法在挖掘医学数据信息时,没有充分利用可用的信息.针对这一问题,提出一种基于改进模糊聚类的Takagi-Sugeno(T-S)模糊系统,将系数调节与指数调节与经典模糊C均值聚类(Fuzzy C-means,FCM)算法结合,替换经典T-S模糊系统中的逻辑元件,合理利用T-S模糊系统在预测与回归等方面的优势的同时,通过指数或系数的灵活调控,深度挖掘医学数据中不同属性间的关联信息,提高算法在众多医学数据分析预测中的准确性.为具体评估算法有效性,在真实医疗数据集上进行实验,实验结果表明,该算法具有更高的预测精度及可行性.  相似文献   

18.
针对传统能耗预测方法不能充分提取数据特征并利用神经网络的学习、预测能力,提出了一种基于经验模态分解-粒子群优化-长短期记忆(EMD-PSO-LSTM)的电力能耗预测模型。该模型首先采用经验模态分解算法将时间序列数据分解为多个本征模函数分量和趋势分量,然后对每个分量分别建立长短期记忆网络进行预测。各个长短期记忆网络的参数则由粒子群算法分别进行最优化求解,最后将所有分量的预测结果进行叠加得到最终的能耗预测结果。将预测结果与实际能耗数据进行对比分析来验证所提模型的预测性能。试验结果表明,该方法能够对电力能耗数据进行合理预测,预测精度较高。  相似文献   

19.
针对果蝇优化算法存在收敛速度慢且易于陷入局部最小值等问题,研究了基于分组协同进化策略的果蝇优化算法.利用分组协同进化策略可以扩大果蝇种群的搜索范围,从而使算法具有快速收敛和跳出局部最优解的能力.利用改进后的果蝇优化算法,对Sphere、Schwefel2.22等8个函数进行测试并与IFOA、WFOA、FOA、PSO、BA算法进行比较分析,结果表明,该算法具有较好的全局搜索能力和较快的收敛速度.  相似文献   

20.
4-香豆素COA连接酶(4CL1)是木质素代谢途径中的一个关键酶,对该基因启动子的表达特性与调控元件进行了研究:首先,对毛白杨4CL1启动子进行了生物信息学分析,结果表明该启动子包括3个顺式作用元件,box P(CCTTCACCAACCCCC),box A(CCGTTC),box L(TCTCACCAACC),这3个顺式作用元件在已知的木质素代谢途径相关酶系如苯丙氨合成酶(PAI)和4CL中普遍存在;其次,运用PCR方法对该启动子进行了剪切,获得一个长393 bp的启动子片断,该启动子片断包括以上3个顺式作用元件;最后,将该启动子片段与GUS报告基因构建了植物表达载体并转化烟草,成功获得转基因再生苗,结果发现转基因烟草的茎木质部呈现GUS染色阳性.研究结果表明,一个393 bp长度的4CL1启动子片断足以介导外源基因在木质部特异性定位表达.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号