首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
为了克服传统机器学习算法产量预测模型的缺点,以深度森林算法理论为基础,综合油井相关各项数据,建立了油井产量预测新模型。首先应用KNN最邻近方法和Z-Score标准化方法对油井相关数据进行预处理,利用MDI特征选择方法选择对油井产量影响最大的特征向量,然后将选出的特征向量作为深度森林模型的输入变量,建立深度森林产量预测模型,利用网格化搜索优化模型参数,最后在测试集上运行模型,对模型性能进行评估。研究结果表明,相对于BP神经网络等传统机器学习算法模型,深度森林模型的产量预测精度更高,可以准确预测油井产量,同时相对于深度神经网络等复杂学习算法,该算法参数少、调参及应用简单,为油井产量预测提供了一种新的方法和思路。  相似文献   

2.
深度交叉网络(DCN)因无法针对不同的数据集准确设置超参数,导致点击率预估模型无法达到最优解。基于此,提出粒子群优化深度交叉神经网络推荐算法(PSO-DCN),该算法通过使用粒子群优化算法的全局搜索特性,对深度交叉神经网络层数及每层神经元个数进行全局搜索,并将其最优值放入DCN模型中运行进行参数优化。在不同的数据集上,进行数次实验对比,实验结果表明PSO-DCN在模型训练速度以及测试集上的表现都较优于当前流行的基于深度学习框架的推荐算法。  相似文献   

3.
现在机器学习对于数据量的依赖性过强,大量数据意味着高价的成本,如何在少量样本上取得可观的预测准确率非常关键,小样本学习就是基于该问题提出的.本研究基于MAML的模型框架,加入任务嵌入的思想.MAML是目前主流的元学习模型,它有泛化性能好、适应性强的特点.在此基础上,我们可以引入动态的特征嵌入进行调整来适应不同的任务,在输入任务后,通过预测网络中的特征层生成参数来调整任务特征嵌入.在常用的小样本学习公开数据集Omniglot和MiniImagenet上实验证明了提出的方法能够提高学习性能.  相似文献   

4.
针对目前高炉炼铁模型精度不高问题,提出建立高炉生产过程中精确的多目标优化模型.首先对高炉的海量数据进行了数据预处理,其次采用支持向量机、随机森林、梯度提升树、XGBoost、LightGBM、人工神经网络6种机器学习算法对高炉焦比、K值进行了预测,并采用特征工程和超参调优对机器学习预测进行了优化,最后采用新的集成学习方法进行预测.预测结果不仅精准度高而且具有很好的鲁棒性.在机器学习的基础之上,采用NSGA-Ⅱ遗传算法对高炉参数进行了多目标优化分析,得到了Pareto最优解,高炉操作者可以根据该多目标优化结果针对不同的需求选择相应的控制参数.  相似文献   

5.
机器学习算法广泛应用于电商用户行为数据分析及商业预测.其中,XGBoost算法作为一种常用的有监督机器学习算法,能够实现电商用户行为特征最优选择与行为模型构建、评估消费价值、预测重复购买行为概率、提高商业决策的精准性与可行性.本研究采用阿里云天池大数据竞赛“天猫复购预测”所提供的“双十一”电商购物节关联数据集中约42万电商平台用户产生的5 500万条行为数据,基于促销活动情境完成特征构造,实现有监督分类学习.本研究实现了XGBoost算法的参数优化与数据特征值处理过程优化,完成了促销活动后6个月内电商用户重复购买行为的预测模型演算.结果表明:优化后的XGBoost算法能够比较精准地预测电商用户重复购买行为、评估在线用户潜在购买价值、实现精准营销以及真正促进促销活动的长期投资回报率提高.  相似文献   

6.
因子分解机(Factorization Machine,FM)是利用矩阵分解思路针对推荐系统中数据稀疏情况设计的机器学习算法.传统的FM模型参数是通过梯度下降方法进行优化求解,但针对数据集训练样本较少的情况,梯度下降方法不能保证参数收敛到全局最优.粒子群算法(Particle Swarm Optimization,PSO)是一种快速启发式算法,具有全局搜索的特性.为提高FM模型的表现能力,首先基于PSO算法确定全局最优位置,然后利用梯度下降优化FM参数,本文提出了PSO-FM算法.在数据集Diabetes进行实验对比,结果表明,改进后的基于粒子群的因子分解机算法PSO-FM在模型训练速度和预测准确度上都优于传统的因子分解机FM算法.  相似文献   

7.
机器学习在面向对象的土地覆被分类中有着重要作用。针对不同机器学习分类器在最优超参数组合下对分类结果的影响并不明确的问题。在WEKA软件平台的基础上以中卫市的WordView3影像为研究数据,系统地讨论了随机森林(RF)、深度神经网络(DNN)、支持向量机(SVM)和决策树(DT)四种常用机器学习分类器的最优超参数组合,并在最优超参数组合下对四种机器学习分类器的分类结果进行了对比分析。研究结果表明:在相同的影像分割、训练样本集和特征提取条件下,使用不同的机器学习分类器均存在一些错分现象,且错分对象不完全一致;RF,DNN和SVM的分类精度明显高于DT,其中RF的分类精度最高,总体精度达到80.8%,卡帕系数达到0.78。  相似文献   

8.
针对模式识别中特征子集的选择存在组合优化的情况,采用了一类遗传序优化算法,以序优化思想为指导,对传统遗传算法中的参数及操作进行改进.利用有限的计算资源寻求复杂特征选择问题的近似最优解,从而有效地降低了特征维数,加快搜索到最优特征子集的速度,为特征选择问题提供了一种新的处理方法.通过Matlab仿真,对美国加州电力市场的实际数据进行预测.结果表明,月平均误差不超过2.62%,因此该算法在电力负荷预测方面有很强的实用性.  相似文献   

9.
申扬  于海  尹晓华 《科学技术与工程》2020,20(32):13302-13308
随着我国电网向智能化、网络化、自动化发展,电网信息通信服务器承载着电网信息网络信息传输中的核心业务。信通服务器一般采用线程池技术来应对逐渐增多的用户请求,而选择合适的线程池尺寸成为了决定服务器性能的关键因素。本文提出一种基于支持向量机的信通服务器动态线程池智能优化模型,来动态减少用户的响应时间。首先,通过大量的信通服务器性能实验数据构造原始训练样本集,然后经过改进的流体优化算法搜索支持向量机的最优超参数,最后通过训练好的支持向量机预测不同电网用户场景下的最优线程池尺寸,从而实现对信通服务器的智能优化。通过辽宁省电网信通服务器的实验表明,基于改进流体优化算法的支持向量机智能线程池技术获得了更高的预测精度,减少了服务器的用户响应时间。  相似文献   

10.
针对风电出力非线性、不稳定且用传统方法难以准确预测的问题,提出了一种基于对深层混合核极限学习机(DHKELM)参数进行优化的短期风电功率预测。利用核主成分分析(KPCA)方法进行特征优选得到的最优特征集,既能表达风电功率的有效信息,也能避免冗余信息的出现,有利于DHKELM模型的学习与训练,同时也降低了模型的复杂度。针对DHKELM超参数难确定的问题,利用改进的野犬优化算法(IDOA)对DHKELM的8个超参数进行寻优,可以发掘原始序列特征信息,从而使模型能够充分掌握数值天气预报(NWP)与风电功率之间的非线性关系。以国外某风电场真实数据为算例,结果表明:提出的预测模型相较于野犬算法、差分进化算法和粒子群优化算法的平均绝对百分比误差(MAPE)分别降低了0.979 3%、2.342 1%、3.383 2%,有效提高了风电功率的预测精度。  相似文献   

11.
决策表最优特征子集的选择--基于粗集理论的启发式算法   总被引:5,自引:0,他引:5  
特征子集选择问题是机器学习的重要问题。而最优特征子集的选择是NP困难问题,因此需要启发式搜索指导求解。基于粗集理论,本文提出了一种新的决策表最优特征子集选择的启发式算法。和以往的方法相比,这种算法简单实用,在一定条件下能够以较高的效率得到最优特征子集。  相似文献   

12.
由于不同气象条件会影响太阳辐照度的有效利用,这制约了太阳能的应用和发展.为了基于不同站点不同采样时刻的气象属性预测中尺度站的太阳能辐照度,依据传统卷积神经网络的框架,建立了一种新型的卷积神经网络结构幵用于太阳能辐照度预测.为了缓解新型网络由超参数选取不当导致预测性能差的问题,利用融合算法对新型网络的超参数进行优化.为了提高融合优化算法的全局搜索能力,引入帐篷映射对粒子的初始位置和初始速度进行混沌初始化.首先,导入训练集更新新型卷积神经网络框架,训练结束后导入验证集检验当前模型参数下新型卷积框架的性能.其次,混沌融合算法依据新型卷积神经框架在验证集上的预测性能更新模型的超参数.对更新模型的超参数多次检验,直至最优的预测模型在验证集上的性能趋于收敛.最后,辒出模型的最优超参数,建立太阳能辐照度预测模型.基于气象实测数据建立太阳能辐照度预测实验,引入其他两种预测方法进行对比仿真研究,幵尽可能复现了Eustaquio and Titericz团队的预测方法(GBRT)作为太阳能辐照度预测性能的评估基准.实验数据表明:混沌融合算法可以有效地提高新型卷积神经网络的预测性能,所提出预测方法的全年太阳能辐照度的均方误差较GBRT降低25.9%,绝对平均误差较GBRT降低了10.7%;全年太阳能辐照度平均误差率降低了18.4%,误差率小于0.1的样本量增加了21.1%.  相似文献   

13.
为了研究超大直径盾构掘进过程地面沉降规律,以武汉市和平大道南延线盾构工程为研究对象,首先收集了超大直径盾构下穿过程掘进参数和地层地质参数,并使用盾构掘进过程深跨比描述超大直径盾构影响特征;其次,通过收集现场沉降测点数据分析盾构隧道施工阶段地表沉降的影响范围,计算了90%、95%、99%三种置信区间下地表沉降影响范围;最后,选取不同范围内的多元时序数据作为输入参数,分别建立了基于贝叶斯优化算法(BO)的长短期记忆(LSTM)、BP神经网络和随机森林(RF)大直径盾构地面沉降预测模型.模型运行过程中,通过贝叶斯优化算法分别寻找三种不同模型下的最优超参数,并通过四种评价指标对比模型精度.结果如下:(1)在90%置信水平下三种算法均表现出最高精度,通过区间计算筛选有效输入参数能有效提高模型预测精度;(2)LSTM对隧道沉降的预测结果优于传统机器学习算法模型,MAPE最低达到8.91%,R2达到90%.  相似文献   

14.
致密油储层因具有渗透率与产能低下的特点,多采用大型水力压裂改造储层来提高采收率,根据不同的地质、压裂参数变化,预测改造后的采收率对于压裂施工改造有良好的指导作用。目前多因素影响的致密油压裂后采收率预测理论模型,难以实时准确地根据压裂方式及参数来预测压裂后油藏采收率变化。为进一步提升致密油的采收率预测精确度,本文引进机器学习进行预测,基于极限梯度爬升算法(XGBoost)和支持向量回归算法(SVR)进行了一定改进得到变权组合模型XGBoost-SVR,模型借鉴残差进化机制,实现加权融合系数的最优组合,该组合模型可对两种单模型进行优势互补,避免了因单一模型参数导致的范围性误差,增大模型预测容错率。本文首先对致密油的采收率影响因素进行收集整理,分析地质因素、储层因素和工程因素对采收率的影响,构造相关原始数据集;其次将预处理后数据集输入SVR单模型和XGBoost单模型分别进行训练,得出单模型预测值;最后采用基于残差的自适应的变权组合方法建立XGBoost-SVR组合模型,得到各模型最终预测结果,明确采收率影响因素及各影响因素权重比。模型预测结果表明:与SVR和XGBoost单模型相比,组合模型在预测精度达到94.63%,表现出更好的适应性。  相似文献   

15.
自动化机器学习是机器学习前沿的一个重要问题,自动化机器学习工具根据数据集及任务需求组合机器学习算子来构造流程,使领域用户在不具备专业机器学习知识的情况下也能完成相应数据分析工作,但目前的自动化机器学习工具普遍存在耗时长和精度低的问题。本文基于数据集相似性和强化学习原理,提出一种数据驱动的自动化机器学习流程的生成方法,利用相似数据集的历史知识,将神经网络与MCTS相结合,指导机器学习流程的生成。实验结果表明:该方法在耗时方面缩短至分钟级别,流程性能也得到提升。  相似文献   

16.
主要针对广受关注的P2P网贷信用评估问题,利用机器学习方法提高申请人网贷违约预测准确率,研究出基于Stacking特征增强多粒度联级Logistic方法及其应用.所提分类器是一种混合模型,结合了Stacking集成学习和联级Logistic学习的思想.首先,通过网格搜索技术分别建立XGBoost, Catboost, LightGBM,AdaBoost以及Gradient Boosting模型,并筛选出适合的基评估器作为Stacking集成的初级学习器,logistic模型作为次级学习器,构建基于Stacking的多粒度扫描器,生成预测结果作为元特征,拼接成新特征数据.其次,通过新特征数据以及元特征在每级Logistic上的特征增强建立联级Logistic Regression模型,并且与现有的单一集成学习器和各基评估器在3个不同的P2P网贷信用评估数据集上进行对比.实验结果表明,通过AUC、准确率等指标对其进行评价,相比于各基评估器以及其他单一集成分类器,基于Stacking增强多粒度联级Logistic模型有较高的准确率,预测效果更优.  相似文献   

17.
针对用区间型数据描述不确定现象的组合预测问题,为了提高区间型数据的预测精度,首先采用诱导有序加权连续区间的广义有序加权平均(IOWC-GOWA)算子将区间数集结为实数;然后对集结后的实数进行标准化处理;最后从信息论的角度引入相对熵作为最优准则,提出了基于IOWC-GOWA算子及相对熵的区间型组合预测模型;另外,通过实例分析了该组合预测模型的合理性和有效性;结果表明:该组合预测模型可以有效地提高区间型数据的预测精度,即该模型是合理有效的,并且,参数λ和BUM函数的选取会对模型的预测精度产生一定的影响。  相似文献   

18.
参数集及参数取值范围的选取是仿真模型标定的前提工作,合理准确的参数集及其范围的选取不仅可以减少标定实验的工作量,还关系到仿真实验结果的准确性。研究基于微观仿真实验数据,发现微观仿真参数对宏观校核指标的敏感性影响形态存在较大差异总结出6种变化形态,优化提出融合趋势分析的连续空间聚类方法,对微观仿真模型参数的作用区间进行分割,并以每一区间的信息熵指标度量区间的数据波动状况,给出参数敏感性取值范围的量化界定方法。最后以交织区为例,给出了面向Vissim仿真平台的参数仿真取值空间,可为其他道路交通设施仿真研究提供参考。  相似文献   

19.
针对天然气负荷影响因素选择困难,冗余因素会影响负荷预测的精度和速度,使用特征选择Relief算法对影响负荷值的因素进行筛选,去掉冗余影响因素,为准确地预测天然气负荷提供一定的数据基础;在进行负荷预测时,单一的支持向量回归(support vector regression, SVR)会陷入重要参数难以选取最优的情况,为了解决这一问题,提出一种基于特征选择上的粒子群算法(particle swarm optimization, PSO)优化SVR重要参数的组合模型PSO-SVR。所提出的算法首先使用特征选择选取影响因素,为负荷预测提供主要的数据支持;然后,设置SVR的3个关键参数的初始值,进行迭代得到最优的关键参数值;最后,将影响因素和负荷值输入PSO-SVR模型进行训练并预测。使用榆济管线的负荷数据进行预测并对比。结果表明:提出的算法比其他单一模型的预测精度高,能为天然气负荷预测的研究提供参考,为天然气公司购气量提供依据。  相似文献   

20.
为了准确地表达PV型旋风分离器的粒级效率与结构参数、操作参数之间复杂的非线性关系,采用PCA-PSO-SVR混合算法对PV型旋风分离器的粒级效率进行建模。采用主元分析法(PCA)对实验数据集进行降维处理,通过粒子群优化算法(PSO)对支持向量回归(SVR)模型中的超参数进行优化。将优化后的回归模型和其它机器学习模型在预测准确性、泛化性、鲁棒性以及运行速度方面进行了对比,结果表明,利用PCA-PSO-SVR算法对PV型旋风分离器的粒级效率建模是一种准确而有效的方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号