首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
为了能够精准可靠地估计太阳能辐照度,本文提出一种基于贝叶斯模型组合的随机森林算法用于太阳能辐照度预测.首先,引入K-means聚类和K折交叉验证将气象数据训练集生成多个训练子集,以增加训练子集的多样性并保证均匀采样.其次,将随机森林作为基学习器建立集成学习预测模型,导入训练子集并训练各个随机森林.之后,依据各个随机森林在验证集上的预测性能,采用贝叶斯模型组合算法制定组合策略.个体随机森林在测试集上的预测值经过模型组合策略得到最终输出.最后,基于气象实测数据建立仿真实验,并引入其他四种预测方法进行对比仿真研究,通过实验结果验证了文中所提出预测方法在太阳能辐照度预测问题中的准确性和可靠性.  相似文献   

2.
为有效进行城市空气质量预测、推进城市空气污染防治,弥补传统统计学模型在大数据时代背景下对城市空气质量预测准确率低、容错能力差等问题,提出利用随机森林回归构建城市空气质量预测模型;综合考量污染物浓度、气象参数、时间参数等多方面影响因素,通过网格搜索法调整参数的最优组合,构建基于随机森林回归算法的城市空气质量预测模型;基于重庆市2017-01-01—2020-07-31的指标数据,对重庆市空气质量进行预测分析,结果表明:在模型下训练集与测试集的确定性系数R~2均在99%以上,均方误差D_(MSE)和平均绝对误差D_(MAE)在训练集和测试集上的取值均在可接受范围内,证实模型具有运行速度快、预测误差小、具有较高的预测精度等优点,具备较好的学习能力与泛化能力。  相似文献   

3.
针对大气污染物质量浓度预测及其大规模数据计算问题,设计了一种基于随机森林算法的污染物质量浓度预测算法,采用MapReduce并行计算框架并行化计算空气质量指数,实现了基于Hadoop平台的空气污染物质量浓度预测系统.通过试验比较了基于随机森林算法和基于线性拟合算法的计算结果,显示本算法能够有效降低大气污染物质量浓度的预测误差.  相似文献   

4.
通过建立灰色离散分数阶预测模型GM(1,1)、BP和RBF神经网络预测模型,以西安市建筑安装涂料产生的VOCs为例,将用于建筑安装的涂料量以及其驱动因子数据作为模型的输入值,用收集整理的2004—2011年16组西安建筑安装涂料消耗量数据进行BP和RBF神经网络训练模拟,2011—2014年5组年数据进行检验预测,采用曲线拟合度和相对误差2个评价指标对3种预测模型结果进行比较分析。结果表明,灰色预测、BP和RBF神经网络预测模型的样本训练及预测的平均误差为:-16.53%,、7.05%,和4.73%,,结合真实值与预测值的曲线拟合和误差下降曲线来看,RBF神经网络的预测结果优于BP神经网络预测结果,采用RBF神经网络预测模型对城市建筑安装VOCs的排放量进行预测具有模拟效果好和预测精度高的优势,对城市VOCs的治理有一定的参考价值。  相似文献   

5.
对于空间数据的插值预测,大多采用传统的空间插值方法如反距离加权插值法和克里金插值法,这2种方法在边缘分布或存在异常值的情况下会导致预测精度相对较低;采用基于Copula理论的方法克服了这一问题。通过Pair-Copula函数描述了空间相依结构并利用MCMC方法(贝叶斯估计法)估计参数,讨论基于空间数据对未观测位置相关数据进行了空间插值预测;结合重庆市雾霾数据对该方法与反距离加权插值法、普通克里金和泛克里金插值法进行比较,结果发现基于Pair-Copula函数的空间预测模型具有更高的精度。  相似文献   

6.
针对热镀锌钢卷力学性能预报建模条件属性选取难、预报精度不足的问题,研究了热镀锌钢卷力学性能梯度提升树(gradient boosting decision tree,GBDT)预报模型。利用互信息差算法综合评估工艺参数、化学成分和钢卷尺寸参数等条件属性的相对重要性以及属性之间冗余性,进行模型条件属性筛选;采用同分布原理进行样本划分,结合网格搜索法和交叉验证法优化模型参数,建立力学性能GBDT预报模型。将GBDT模型预报结果与随机森林(random forest,RF)、AdaBoost算法和BP神经网络的预报结果进行比较,比较表明GBDT模型优于其他模型,90%的数据样本预测的绝对误差小于14.24 MPa,94.6%的数据样本相对误差在6%范围内,具有更高的预测精度。  相似文献   

7.
暴雨内涝的快速预测对于提升灾害应急处置能力具有重要意义。针对传统数值模拟复杂耗时导致难以满足暴雨内涝预测时限要求的问题,该文基于机器学习方法构建城市暴雨内涝时空快速预测模型。利用城市综合流域排水模型(InfoWorks ICM)模拟的高精度网格结果作为数据驱动,综合考虑降雨因素、地理数据以及排水管网的分布情况,分别基于随机森林、极限梯度提升(XGBoost)、K最近邻以及长短期记忆(LSTM)神经网络建立城市暴雨内涝快速预测模型。以北京市某区域为例,开展算例研究,结果表明:随机森林模型的空间预测效果最佳,淹没范围预测准确率可达99.51%,积水深度平均预测误差3.55%; LSTM神经网络模型能准确预测内涝点积涝过程的水深时序变化。在该算例场景下,所构建的机器学习模型可实现s级的暴雨内涝时空快速预测。  相似文献   

8.
李帅  杨柳  赵欣卉 《科学技术与工程》2023,23(25):10866-10878
城市的交通拥堵已经成为了各个城市中的普遍现象,严重影响了城市日常交通以及人们的出行。针对城市区域交通流的研究与分析,本文为了准确的对城市交通状态进行预测,通过网格划分的方法,把城市区域划分为多个区域,根据城市交通数据流的时空特征,提出了一种基于深度学习的城市交通拥堵预测模型(CS-Transformer)。该模型通过使用卷积神经网络(CNN)提取基于网格划分的城市区域交通数据的空间特征,然后采用全连接神经网络增强模型的表达能力,再通过相似性位置编码机制(SPEM)把位置信息加入交通数据中,最后运用Transformer网络捕捉交通数据的时间依赖特征。用成都市出租车GPS数据对模型进行验证,结果表明该模型预测结果优于卷积神经网络(CNN)、Transformer和CNN-Transformer等模型,以均方误差(MSE)为评价指标,将测试集中交通路网的平均预测精度分别提高了 19.6%、26.3%和10%。  相似文献   

9.
基于数据挖潜建立了压裂油井产量预测与合理压裂参数优选的灰色关联投影随机森林算法,采用加权的灰色关联投影方法筛选出数据集;采用网格搜索交叉验证方法对森林模型参数进行优化;在此基础上训练随机森林回归模型进行产量预测,结合响应面分析方法对压裂参数进行优化。产量预测实例表明该算法的决定系数0.918 9高于随机森林算法、梯度提升决策树算法;三口井日产油实际值与预测值之间的误差为9.6%、1.2%、1.1%。结合新疆玛湖油田实际储层对M1井进行压裂优化:总压裂液量21 000 m~3、裂缝簇数34条、总砂量1 181.86 m~3为最佳压裂参数,此时日产油为44.356 m~3。  相似文献   

10.
为提高XGBoost算法预测精度,采用布谷鸟搜索算法全局优化XGBoost的超参数包括学习率、输出结点分裂的最小损失、树模型的最大深度和弱学习器的数量,构建CS-XGBoost模型训练数据集。实验结果表明,基于CS-XGBoost的收入分类模型的准确率、精确率、F1分数和AUC等指标分别为95.67%、97.17%、95.56%和97.96%,均优于Logistic回归、支持向量机、随机森林、XGBoost算法和基于网格搜索的XGBoost算法;基于CS-XGBoost的房价预测模型的决定系数、均方根误差及平均绝对误差分别为0.905 5、2.943 5及2.165 4,预测精度较XGBoost算法得到显著提升。  相似文献   

11.
为提高热连轧粗轧带钢生产过程中换钢种、换规格及换辊后的首块带钢宽度设定模型精度,本文提出一种基于主成分分析协同随机森林(PCA-RF)算法的宽度预测模型.采用主成分分析法对数据样本合理分析,通过计算特征值、主成分贡献度及累计贡献度进行特征选择.在PCA筛选的变量数据集上训练最佳随机森林宽度预测模型.同时,使用支持向量机回归(SVR)、K-最近邻(KNN)模型进行对比验证.通过实际应用表明,PCA-RF各道次宽度模型R-squared值控制在99.9%~1,且96%以上样本点预测误差在-5~5mm,从而证明该模型实现了换钢种、换规格及换辊后的首块钢宽度的高精度预测.  相似文献   

12.
针对天然气燃气轮机污染物预测难度大的问题,该文基于数值模拟方法研究了燃烧室头部旋流数、分级面积比、分级轴向距离等典型因素对污染物生成的影响,在此基础上提出了基于神经网络的燃气轮机污染物预测模型。研究结果表明:头部旋流数、分级面积比增大会导致燃烧室内部最高温度升高,NOx排放增多,而CO排放无明显变化;所构建的神经网络预测模型预测结果与数值模拟结果吻合,其中预测NOx平均误差为4.58%, CO平均误差为0.97%,证实了神经网络模型预测燃气轮机污染物排放可行且准确。  相似文献   

13.
为研究路堑开挖爆破对邻近民房安全的危害,运用主成分分析及随机森林算法对其进行预测.选取爆破参数、地质条件、民房结构3个方面的共16项重要影响因素,采用主成分分析法并从中提取6个主要成分.以主成分值为输入,房屋安全程度的量化值为输出,建立路堑开挖爆破对邻近民房安全危害的随机森林预测模型.利用18组工程实例数据为训练样本,另外4组数据为检验样本,进行了模型的预测实验.实验结果表明:基于主成分分析的随机森林模型对数据的拟合度较高,预测误差低,该模型可以作为实现路堑开挖爆破对邻近民房安全危害预测的一个有效方法.  相似文献   

14.
随机森林算法是根据Bagging抽样和随机特征子集划分策略,由多棵决策树组成的集成算法.与其他分类算法相比,随机森林算法有更高的分类精度、更低的泛化误差以及训练速度快等特点,因此在数据挖掘领域得到了多方面的应用.然而随机森林算法在分类预测特征维度高且不平衡的数据时,分类性能受到了极大限制.为了更好地处理高维不平衡数据,...  相似文献   

15.
提出一种基于基因表达式编程算法(GEP)的人口预测新方法,并将该方法应用于东莞市人口预测实例问题研究。实验结果表明:由于基因表达式编程算法采用基因型与表现型相统一的编码方式、高效的遗传算子以及全局搜索的寻优方式,基于GEP算法的人口预测模型能够在样本少的情况下给出相对准确的预测结果。其验证数据的预测绝对值平均误差为0.96%,与灰色系统GM(1,1)预测模型及径向基人工神经网络预测模型相比,预测精度分别提高了18.34%、30.54%。GEP人口预测模型能够更好地挖掘人口发展的复杂非线性模式,有效防止过度拟合现象的发生,提供更为准确、合理的拟合及预测结果。  相似文献   

16.
为有效预测海底管道因腐蚀导致的泄漏风险,提出了一种海底管道腐蚀泄漏预测模型,首先采用斯皮尔曼相关系数分析各影响因素间的相关性,随后基于随机森林袋外数据进行各因素的重要性排序,剔除掉相关性较高且重要性较小的因素,利用筛选出的数据建立前馈神经网络和随机森林回归预测模型,并利用粒子群算法对神经网络预测模型的权值、阈值进行了优化,构建粒子群优化下的神经网络预测模型。经分析结果表明:神经网络预测模型在5组随机模型训练中平均绝对误差(MAE)、均方误差(MSE)的平均值分别为1.59、 3.37,均高于随机森林回归预测模型,说明该模型误差较大,但决定系数(R2)较随机森林回归预测模型高0.13,因决定系数越接近于1,模型拟合越好,故随机森林回归预测模型较神经网络预测模型拟合度较差,长期预测误差较高,因此可采用粒子群算法对神经网络进行优化,优化后的模型MAE为0.79,MSE为0.7293,R2为0.9151,可见优化后的神经网络预测模型在保证精度的基础上提高了稳定性,预测效果更优。最后编制了集随机森林回归、神经网络及粒子群优化下的神经网络为一体的多模型管道腐蚀预测软件。为海底管道泄漏风险的精准预测以及高效控制提供了依据,在海洋油气运输安全方面具有重要意义。  相似文献   

17.
针对现今传统统计方法难以准确及时的揭示经济参量时空信息且估算GDP精度不足的问题,本文利用国家极轨卫星携带的可见光和近红外成像辐射计(NPP/VIIRS)获取的2012-2018年夜间灯光影像为数据源,对数据产生的误差进行处理得到了可以用来定量分析的长时间序列数据;首先采用随机森林算法对数据集进行预测研究,在此基础上提出一种基于袋外数据估计的回归误差,采用改进的网格搜索算法(Grid Search)对随机森林模型进行参数调优。同时也使用贝叶斯优化(Bayesian Optimization)对随机森林(RF)模型进行参数调优。运用嵌套5F-CV,并通过外部5F-CV循环估算模型的泛化能力,内部5F-CV循环用于确定最佳参数找出最优参数模型,建立自动预测系统,根据输入的研究区数据,使算法模型自动进行精准预测。结果表明基于贝叶斯优化改进的随机森林算法在预测GDP时最好,预测精度达到97%,具有较高的准确率和鲁棒性。研究结果展示了机器学习算法和夜间光照指数用于在县级尺度上预测GDP表现出显著的能力。  相似文献   

18.
准确地预测航线的客流量,对于航空公司的运力安排、航线调整、规划发展都有着重要的作用.针对民航客流量预测具有诸多不确定性和数据不足的特点,基于某航空公司2010年—2017年北京—三亚航线每天的客流数据,运用了随机森林预测模型、支持向量机回归模型、神经网络模型对航线数据进行了数据拟合.经验证,3个模型的平均绝对误差分别为4. 18%、6. 87%、12. 38%,其中,随机森林预测模型精度最高,效果最佳,可以用于客流预测仿真.  相似文献   

19.
以某金属加工厂为例,对地块土壤进行污染状况调查,针对调查结果中的超标因子镍,应用普通克里金插值法进行污染范围预测。根据预测结果,土壤中镍浓度超标区域主要分布在地块南侧,叠加不同深度采样层的超标范围后,地块镍含量超标区域面积为2. 1918hm2,占地块总面积的40. 59%。为消除克里金插值法平滑效应引起的预测结果偏差,在实际应用中,应在预测的污染边界线两侧进行补充采样监测,提高地块污染范围的准确性。  相似文献   

20.
卡尔曼滤波修正的风电场短期功率预测模型   总被引:8,自引:0,他引:8  
针对数值天气预报模型输出的气象参数存在系统误差而导致风电场功率预测精度受到制约的问题,提出了一种基于卡尔曼滤波修正的风电场短期功率预测模型.使用卡尔曼滤波算法对数值天气预报输出的风速数据进行动态修正,并结合其他气象数据形成新的用于风电功率预测的修正气象数据集合;根据原始气象数据和修正气象数据这2个训练集分别建立了风电场功率输出的原始神经网络、修正神经网络的预测模型.经同一时间区间内的实测数据与模型分析数据的对比分析表明:通过卡尔曼滤波修正的风速数据能够很好地跟踪实际风速数据的变化趋势,平均误差与绝对平均误差比较小;所提模型能够显著降低预测结果的均方根误差,使其从未修正前的17.73%降低至11.32%,证明预测精度得到了明显提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号