首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为提高路段短时交通流的预测精度,选取路段平均旅行时间作为预测指标,建立了一种基于极端样度上升(extrem gradient boosting,XGBoost)的短时交通流预测模型。首先通过对交通流数据的分析,在考虑交通流时空特性的基础上,分别构建目标路段时间序列训练集、测试集以及时空序列训练集、测试集,然后基于XGBoost模型以及构建的训练样本集建立时间序列预测模型以及时空序列预测模型,并利用训练好的模型进行预测,最后将模型预测结果与线性回归模型、神经网络模型预测结果进行比较。实验结果表明:基于XGBoost的短时交通流预测模型能够对路段未来时段平均旅行时间进行比较准确的预测,其中时间序列预测模型均方根误差为5. 32,时空序列预测模型均方根误差为4. 82,均低于线性回归模型和神经网络模型,且相比于仅考虑时间因素的短时交通流预测模型,同时考虑时空因素的预测模型得到的误差更低,预测效果更好。  相似文献   

2.
为有效防治大气污染,依据大气污染的各项指标值来预测城市空气质量级别并给出起主导作用的因素,提出基于随机森林的空气质量等级分类预测方法;随机森林模型直接给出影响空气质量指标的重要性评分以便于找出最重要的影响因素,比较不同的数据挖掘方法,结果显示:随机森林分类预测的准确率最高,因此该模型可广泛应用于空气质量预测中;测试集结果显示随机森林方法不易受噪声影响且泛化误差较低,重要性评分给出细颗粒物和可吸入颗粒影响为最重要的两个因素,并以保定市为例有针对性地给出提高空气质量的建议。  相似文献   

3.
为有效预测海底管道因腐蚀导致的泄漏风险,提出了一种海底管道腐蚀泄漏预测模型,首先采用斯皮尔曼相关系数分析各影响因素间的相关性,随后基于随机森林袋外数据进行各因素的重要性排序,剔除掉相关性较高且重要性较小的因素,利用筛选出的数据建立前馈神经网络和随机森林回归预测模型,并利用粒子群算法对神经网络预测模型的权值、阈值进行了优化,构建粒子群优化下的神经网络预测模型。经分析结果表明:神经网络预测模型在5组随机模型训练中平均绝对误差(MAE)、均方误差(MSE)的平均值分别为1.59、 3.37,均高于随机森林回归预测模型,说明该模型误差较大,但决定系数(R2)较随机森林回归预测模型高0.13,因决定系数越接近于1,模型拟合越好,故随机森林回归预测模型较神经网络预测模型拟合度较差,长期预测误差较高,因此可采用粒子群算法对神经网络进行优化,优化后的模型MAE为0.79,MSE为0.7293,R2为0.9151,可见优化后的神经网络预测模型在保证精度的基础上提高了稳定性,预测效果更优。最后编制了集随机森林回归、神经网络及粒子群优化下的神经网络为一体的多模型管道腐蚀预测软件。为海底管道泄漏风险的精准预测以及高效控制提供了依据,在海洋油气运输安全方面具有重要意义。  相似文献   

4.
为了能够精准可靠地估计太阳能辐照度,本文提出一种基于贝叶斯模型组合的随机森林算法用于太阳能辐照度预测.首先,引入K-means聚类和K折交叉验证将气象数据训练集生成多个训练子集,以增加训练子集的多样性并保证均匀采样.其次,将随机森林作为基学习器建立集成学习预测模型,导入训练子集并训练各个随机森林.之后,依据各个随机森林在验证集上的预测性能,采用贝叶斯模型组合算法制定组合策略.个体随机森林在测试集上的预测值经过模型组合策略得到最终输出.最后,基于气象实测数据建立仿真实验,并引入其他四种预测方法进行对比仿真研究,通过实验结果验证了文中所提出预测方法在太阳能辐照度预测问题中的准确性和可靠性.  相似文献   

5.
为提高XGBoost算法预测精度,采用布谷鸟搜索算法全局优化XGBoost的超参数包括学习率、输出结点分裂的最小损失、树模型的最大深度和弱学习器的数量,构建CS-XGBoost模型训练数据集。实验结果表明,基于CS-XGBoost的收入分类模型的准确率、精确率、F1分数和AUC等指标分别为95.67%、97.17%、95.56%和97.96%,均优于Logistic回归、支持向量机、随机森林、XGBoost算法和基于网格搜索的XGBoost算法;基于CS-XGBoost的房价预测模型的决定系数、均方根误差及平均绝对误差分别为0.905 5、2.943 5及2.165 4,预测精度较XGBoost算法得到显著提升。  相似文献   

6.
利用机器学习和多元线性回归模型对西安市近一年的空气质量指数进行了研究,首先利用随机森林思想对数据进行了补齐,然后运用交叉验证对神经网络模型选取最优的隐层节点数和训练周期数,最后,通过比较两种模型的拟合效果发现,神经网络模型在对空气质量指数的预测效果明显好于多元线性回归模型。  相似文献   

7.
随着城市化和工业化的快速发展,空气污染问题日益突出,空气质量预测显得尤为重要。当前一些有代表性的研究对空气质量进行实时监测和预报,例如周广强等采用数值预报的方法对中国东部地区的空气质量进行分析,但其实验结果表明该方法难以预测非常重的污染;SANKAR等使用多元线性回归对空气质量进行预测,但其实验结果表明线性模型预测精度低、效率慢;PéREZ等使用统计方法对空气质量进行预测,实验结果证明统计方法的预测精度比较低;WANG等采用改进的BP神经网络建立了空气质量指数的预测模型,其实验验证了BP神经网络收敛速度慢、容易陷入局部最优解的问题;YANG等利用相邻网格的空气质量浓度效应,建立了基于随机森林的PM_(2.5)浓度预测模型,通过实验过程证明网格划分程序削弱了后续空气质量分析的质量和效率。这些方法都难以从时间角度建模,其中预测精度低是比较重要的问题。因为预测精度低可能会导致空气质量预测结果出现较大的误差。针对空气质量研究中预测精度低的问题,提出了基于长短期记忆单元(long short-term memory,LSTM)的神经网络模型。该模型使用MAPE,RMSE,R,IA和MAE等指标来检测LSTM神经网络与对比模型的预测性能。由于Delhi和Houston是空气污染程度比较严重的城市,所以使用的实验数据集来自Delhi的Punjabi Bagh监测站2014—2016年的空气质量数据和Houston的Harris County监测站2010—2016年的空气质量数据。LSTM神经网络与多元线性回归和回归模型(SVR)的比较结果表明,LSTM神经网络适应多个变量或多输入的时间序列预测问题,LSTM神经网络具有预测精度高、速度快和较强的鲁棒性等优点。  相似文献   

8.
提出了使用深度栈式自编码模型进行空气质量预测.选择了PM2. 5、PM10等污染物数据作为样本.本模型基于Java平台构建,进行了训练和参数调整,建立了最优的空气预测模型.根据北京市的实验结果表明,该模型具有良好的精度.与支持向量回归(SVR)模型和线性回归模型相比,本文提出的模型具有优越的性能.  相似文献   

9.
文章提出了一种新的空气质量预测模型,可同时对空气质量指数AQI和6个污染指标进行预测.该模型通过主成分分析(PCA)提取空气质量矩阵的主要特征并进行压缩,然后将压缩矩阵与差分移动平均自回归模型(ARIMA)相结合,来预测未来的空气质量.最后在公开的空气质量数据集上进行了实验.实验结果表明,该文提出的P-ARIMA模型能够有效地提高预测精度并减少计算所需的时间.  相似文献   

10.
直流输电电流转换过程中产生大量的热量,阀冷系统的作用是对热量进行及时消散,以保证系统稳定运行,是直流输电工程的核心设备。膨胀罐是保证阀冷系统压力稳定的关键,提前预测膨胀罐排气、补气阀状态能提高系统运行效率。膨胀罐液位是反映其状态的重要指标,该文建立基于随机森林算法的阀冷系统膨胀罐液位预测方法。首先,采集阀冷系统重要参数数据,包括电极功率、环境温度、内冷进(出)阀温度等,分析关联数据对膨胀罐液位的影响关系;其次,开发随机森林回归算法,利用训练集数据对膨胀罐的液位进行预测建模,得到预测模型;最后,利用测试集数据对所建立的预测模型进行综合仿真,结果表明模型预测数据能够很好地与实测数据拟合,说明该文膨胀罐液位预测模型的有效性。  相似文献   

11.
为提升烟草市场监管水平,通过某烟草专卖局的协作调研和历史销售数据,构建基于深度自回归网络(Deep auto regression network, DARN)和季节性自回归差分移动平均模型(Seasonal auto regression integrated moving average, SARIMA)的混合预测模型。然后以预测销量为基础进行异常检测,设计了烟草商户违法销售预警模型。实验表明混合预测模型较单个模型预测误差均有改善。预警模型在测试集上达到50%查实率,满足市场监管预警基本要求。  相似文献   

12.
荷电状态(state-of-charge,SOC)是锂离子电池预测和健康管理非常重要的一部分。锂离子电池的SOC无法直接测量,因此本文提出了基于随机森林回归算法的锂离子电池SOC估计的方法。首先构建随机森林回归模型,使用电池电流、电池电压、电池温度作为模型的训练输入,相对应的SOC作为模型的训练输出;然后使用随机森林算法进行模型训练;最后将训练模型应用于电池SOC估计。实验结果表明,随机森林回归算法对锂离子电池荷电状态的预测最大估算误差为0.02,均方根误差为0.003 204,该方法能有效地估算锂离子电池SOC并且有很高的估计精度。该模型研究为未来电池荷电状态估算系统的模型构建提供了参考。  相似文献   

13.
基于数据挖潜建立了压裂油井产量预测与合理压裂参数优选的灰色关联投影随机森林算法,采用加权的灰色关联投影方法筛选出数据集;采用网格搜索交叉验证方法对森林模型参数进行优化;在此基础上训练随机森林回归模型进行产量预测,结合响应面分析方法对压裂参数进行优化。产量预测实例表明该算法的决定系数0.918 9高于随机森林算法、梯度提升决策树算法;三口井日产油实际值与预测值之间的误差为9.6%、1.2%、1.1%。结合新疆玛湖油田实际储层对M1井进行压裂优化:总压裂液量21 000 m~3、裂缝簇数34条、总砂量1 181.86 m~3为最佳压裂参数,此时日产油为44.356 m~3。  相似文献   

14.
为提高热连轧粗轧带钢生产过程中换钢种、换规格及换辊后的首块带钢宽度设定模型精度,本文提出一种基于主成分分析协同随机森林(PCA-RF)算法的宽度预测模型.采用主成分分析法对数据样本合理分析,通过计算特征值、主成分贡献度及累计贡献度进行特征选择.在PCA筛选的变量数据集上训练最佳随机森林宽度预测模型.同时,使用支持向量机回归(SVR)、K-最近邻(KNN)模型进行对比验证.通过实际应用表明,PCA-RF各道次宽度模型R-squared值控制在99.9%~1,且96%以上样本点预测误差在-5~5mm,从而证明该模型实现了换钢种、换规格及换辊后的首块钢宽度的高精度预测.  相似文献   

15.
为探究不同形态城市道路交通事故的发生原因,将事故形态的影响因素进行筛选和约简,选取3种不同算法对事故形态进行分析与预测,对比预测模型的准确性。采用粗糙集理论对原始交通事故形态影响因素变量进行转换和约简,获得满足建模要求的试验数据,并按照总体一致原则把数据等分为训练集和测试集。基于C5.0决策树算法,构建交通事故形态预测决策树模型并进行模型准确性验证,生成交通事故形态规则集;另外,采用似然比检验筛选自变量构建交通事故形态多元Logistic回归预测模型;构建多层感知器(MLP)神经网络预测模型,检验模型训练集与测试集的准确率并进行对比分析。结果表明:3种模型中,C5.0决策树算法对交通事故形态在训练集和测试集中的预测准确率分别为80.39%与79.63%,高于多元Logistic回归模型和MLP神经网络模型。采用C5.0决策树算法得到交通事故形态主要影响因素为交通方式的选取,行驶在道路横断面位置,违法行为与行驶状态等,解释性良好。研究可为分析及预测城市道路交通事故形态,分析事故产生原因提供方法参考,还可为交通管理部门提供决策依据。  相似文献   

16.
在盾构掘进过程中,竖向姿态控制难度较大,盾体常与设计轴线产生偏差。为解决既有盾构姿态预测模型无法准确提取数据特征和有效去除数据噪声的问题,充分挖掘盾构掘进实测数据时间序列信息,依托合肥地铁7号线耕耘路站—清潭路站区间盾构隧道工程,对收集的掘进数据进行预处理,包括去除停机状态数据及异常数据,提出用于盾构竖向姿态预测的CNN-LSTM组合模型,并将测试集上的模型预测结果与传统回归模型进行对比,最后对不同样本数量及固定网络参数时的模型性能进行研究。研究结果表明:CNN-LSTM组合模型对盾构竖向姿态的预测效果较好,在测试集上的预测平均绝对误差EMA和均方根误差ERMS较低,同时预测的决定系数R2较高,表明模型具有较小的预测误差和较高的预测精度;与ARIMA、LSTM和SVR模型相比,CNN-LSTM模型在测试集上预测的R2分别提高了1.04%、19.75%和79.63%,此外,模型的预测EMA和ERMS较低,并且训练耗时显著降低;不同训练集样本数量对CNN-LS...  相似文献   

17.
基于无人机高光谱影像,建立地形复杂地区植被覆盖度的非参数随机森林回归估算模型。为获得构建随机森林模型所需的足够数量的训练样本,利用低空无人机搭载的光学相机,在从地面难以到达的山地、水域和植被茂密区,通过垂直拍摄获得厘米分辨率的航拍影像,作为对地面样方采样的补充。首先计算地面数码相机照片和无人机可见光影像的红绿蓝植被指数(red-green-bluevegetationindex,RGBVI),然后使用大津分割法提取样方的植被覆盖信息,得到构建模型所需的训练样本。在此基础上,基于2018年8月16—18日在内蒙古自治区察右中旗油娄沟矿区获取的GaiaSky-mini2无人机高光谱影像数据,利用递归特征消除算法优选参与随机森林回归的特征变量集,利用空地协同获取的训练样本构建植被覆盖度的随机森林回归估算模型。该模型在测试集上的确定系数R2为0.923,均方根误差为0.087,优于常用的像元二分模型,可用于矿区植被动态信息的精细化监测。  相似文献   

18.
针对江苏省空气质量指数(air quality index, AQI)的预测问题,提出一个将反向(back-propagation, BP)神经网络与ε-支持向量回归机(ε-support vector regression,ε-SVR)算法相结合的SVR-BP回归算法。对训练集采用ε-SVR进行样本筛选组成新的样本集,再采用BP神经网络进行预测。样本集选取的时间跨度为2 a,样本数据为江苏省共98个监测点空气中各成分的含量。分别采用SVR-BP算法、BP神经网络和ε-SVR算法在数据更新频度不同的3个模型下对未来72 h的AQI进行预测。实验结果表明:本研究提出的SVR-BP算法的平均绝对百分误差较ε-SVR算法提升了4%~19%;训练时间比BP神经网络少0.1~2.5 s。SVR-BP算法预测AQI更为高效,在实时训练及样本筛选方面有更广阔的研究前景。  相似文献   

19.
 边坡工程是露天煤矿中的重点工程,边坡的稳定性关系着煤矿的安全生产。边坡稳定性预测是边坡防治工作的前提,针对煤矿边坡工程稳定性预测的复杂性,为了快速、有效地判别煤矿边坡稳定性,利用随机森林算法建立煤矿边坡稳定性预测模型。通过选取与煤矿边坡工程密切相关的岩石重度、黏聚力、内摩擦角、边坡角、边坡高度、孔隙水压力6 个指标作为边坡稳定性的影响因素,即为随机森林预测模型的输入,边坡稳定性状态作为随机森林预测模型的输出,通过随机森林算法建立边坡稳定性影响因素与边坡稳定状态之间的非线性关系。利用煤矿实测30 组边坡稳定性数据作为随机森林预测模型的训练数据集,进行模型的学习训练;另用12 组边坡稳定性数据作为预测模型的测试数据,通过训练好的边坡稳定性预测模型进行测试;为了验证随机森林预测模型的准确率,同时与SVM 和BP 神经网络的测试数据进行比较。结果说明,选取煤矿边坡稳定性的6 个指标建立的随机森林预测模型,人工控制参数较少、结构简单、容易实现,且具有较高的准确度,边坡稳定状态预测结果与煤矿边坡工程实际状态相吻合,能有效预测边坡稳定性状态,指导煤矿边坡防治工作的开展。  相似文献   

20.
边坡工程是露天煤矿中的重点工程,边坡的稳定性关系着煤矿的安全生产。边坡稳定性预测是边坡防治工作的前提,针对煤矿边坡工程稳定性预测的复杂性,为了快速、有效地判别煤矿边坡稳定性,利用随机森林算法建立煤矿边坡稳定性预测模型。通过选取与煤矿边坡工程密切相关的岩石重度、黏聚力、内摩擦角、边坡角、边坡高度、孔隙水压力6个指标作为边坡稳定性的影响因素,即为随机森林预测模型的输入,边坡稳定性状态作为随机森林预测模型的输出,通过随机森林算法建立边坡稳定性影响因素与边坡稳定状态之间的非线性关系。利用煤矿实测30组边坡稳定性数据作为随机森林预测模型的训练数据集,进行模型的学习训练;另用12组边坡稳定性数据作为预测模型的测试数据,通过训练好的边坡稳定性预测模型进行测试;为了验证随机森林预测模型的准确率,同时与SVM和BP神经网络的测试数据进行比较。结果说明,选取煤矿边坡稳定性的6个指标建立的随机森林预测模型,人工控制参数较少、结构简单、容易实现,且具有较高的准确度,边坡稳定状态预测结果与煤矿边坡工程实际状态相吻合,能有效预测边坡稳定性状态,指导煤矿边坡防治工作的开展。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号