首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 78 毫秒
1.
【目的】比较分析XGBoost模型、LightGBM模型、随机森林模型(RF)、K最近邻模型(KNN)、长短期记忆神经网络(LSTM)、决策树模型(DT)共6个PM2.5浓度预测模型,以准确、及时预测环境PM2.5浓度。【方法】基于重庆市合川区2020年全年空气质量监测数据和气象数据,通过最大相关最小冗余算法(MRMR)进行数据降维选择最优特征子集,作为模型的输入,逐一进行PM2.5浓度预测;考虑到不同季节PM2.5浓度差异较大,故分季节预测了PM2.5浓度;为了探究各模型预测性能,计算了各模型运行时间和内存占用,并基于PM2.5与特征变量的相关性和特征变量的重要性探讨了模型预测性能季节性差异原因。【结果】模型总体预测精度从高到低排序为 XGBoost、RF、LightGBM、LSTM、KNN、DT模型;预测性能方面,6个模型均表现为秋冬季节预测精度高于春夏季节;LightGBM模型可在保证模型精度的情况下,大幅减少模型训练时间和内存占用;特征重要性显示PM10浓度、气温和气压的重要性高,O3浓度、风向和NO2浓度重要性相对较弱。【结论】采取MRMR方法进行数据降维选取的最优特征子集能较好地预测PM2.5浓度;相比较而言,XGBoost、RF、LightGBM、LSTM模型在PM2.5浓度预测上具有较优性能,其中综合性能较好的为LightGBM模型。  相似文献   

2.
目前PM2.5的计算主要采用物理方法,其成本较高.为此,通过采集空气中O3,CO,PM10,SO2,NO2的浓度数据,选择神经网络方法建立PM2.5预测模型.实验结果表明,该模型对PM2.5的预测准确率较高.  相似文献   

3.
【目的】分季节预测PM2.5浓度值,利用PCA方法对数据进行降维,分析季节及气象因素对PM2.5的影响,在提高预测准确率的同时降低时间复杂度。【方法】以合肥市2014—2017年的PM10、SO2、CO2、CO、O3浓度值,以及同时段的气象因素值,对PM2.5浓度进行预测。数据分析中发现PM2.5在不同季节浓度差异较大,故本研究选择分季节进行预测;为了提高预测准确率,加入如风力、温度、湿度、气压等气象因素进行预测,同时采用主成分分析(PCA)的方法进行数据降维,将降维后的数据再输入BP神经网络模型进行预测。【结果】实验采用3组实验进行对比:5种污染物指标(PM2.5-5)预测PM2.5、加入气象因素的综合12项指标(PM2.5-12)预测PM2.5、对综合指标进行PCA处理后的(PM2.5-PCA)预测PM2.5。实验结果表明:4个季节的PM2.5浓度值有较大变化,均方根误差(RMSE)的差值较大;采用PM2.5-PCA的方法,在任何季节的RMSE均有降低,相关系数(r)均有所提高。【结论】PM2.5浓度具有季节性特征,采用季节性预测方法可以提高预测准确率;同时采用PCA方法进行降维,可以在保证准确率的同时降低预测时间复杂度。  相似文献   

4.
针对PM2.5浓度预测模型效果不稳定、泛化能力差的问题,以循环神经网络和注意力机制为基础,提出了二向注意力循环神经网络(TDA RNN)。首先,TDA-RNN模型通过注意力机制获取输入数据的时序注意力和类别注意力,并将其进行融合;然后通过特征编码器对融合后的数据进行编码,获得中间特征;最后将中间特征与PM2.5浓度的历史信息融合,并通过特征解码器获取预测值。对北京地区的PM2.5浓度进行了预测。结果表明,相比前向型神经网络、长短期记忆神经网络、门控循环单元模型和滑动平均模型,TDA-RNN模型预测精度更高;在抗干扰测试中,当输入数据存在无关因素时,TDA RNN模型的预测精度出现轻微下降,但仍高于其他模型。该二向注意力循环神经网络特征提取能力强,预测精度高,同时可适用于其他场景的多变量时间序列预测。  相似文献   

5.
分析了气溶胶粒径吸湿增长因子、风速和NO_2与消光系数和PM_(2.5)质量浓度之间的相关性及影响规律。提出了一种基于消光系数的机场PM_(2.5)质量浓度神经网络预测模型。首先,建立消光系数与PM_(2.5)质量浓度之间的定量关系,并分析相对湿度对其影响。然后,分析风速和NO_2对消光系数和PM_(2.5)质量浓度的影响。最后,将四项参数与PM_(2.5)质量浓度之间的复杂关系通过模糊神经网络进行学习和表达,实现PM_(2.5)质量浓度的预测。使用实测PM_(2.5)质量浓度数据对预测模型进行了对比验证。结果表明,该预测模型的预测精度较高,能较为客观的反映机场PM_(2.5)质量浓度的变化情况,这对研究颗粒物质量浓度对机场能见度的影响规律以及机场周边污染治理决策提供数据支持具有重要的意义。  相似文献   

6.
空气中PM2.5浓度问题越来越受到各界的关注。根据PM2.5浓度数据的特征,首先选择ARIMA预测模型进行浓度预测;考虑到BP神经网络易陷入局部最小,而遗传算法具有全局搜索的能力,给出了遗传算法优化的BP神经网络预测模型;为了进一步提高预测精度,引入IOWGA算子,将ARIMA预测模型与遗传算法优化的BP神经网络预测模型相组合,给出了基于IOWGA算子的组合预测模型;最后经过实例仿真分析验证了模型的可行性和有效性,为PM2.5浓度预测提供基础资料。  相似文献   

7.
为探究皖北城市群大气污染物在不同地域、不同时间下的分布规律以及影响空气中PM2.5浓度的相关变量,结合2018-2021年安徽省生态环境厅统计数据及相关地域资料,采用主成分分析(PCA)法按时间段长短及季节性变化分别选取月度数据与年度数据对空气质量的影响因子做相关性分析,对比分析不同季节下空气污染物PM2.5、PM10的浓度及其它空气污染物的变化,构建基于PCA算法的反向传播神经网络 (BP),建立PCA-BP模型并采用交叉-验证法提高模型精度,对大气中的污染物PM2.5浓度做短期预测。实验结果表明:PM2.5浓度的主要影响因子为PM10、CO、NO2、SO2;皖北地区PM2.5含量整体在冬季偏高;预测模型的精度在夏季与秋季较高,冬季较低,四季的预测精度R2分别达到0.924、0.958、0.935、0.794。  相似文献   

8.
以北京市为例, 利用2015—2018年空气质量监测站台资料, 通过BP神经网络、LSTM网络及CNNLSTM混合模型等多种模型, 分析时间精度和空间信息对PM2.5浓度预报的影响。结果表明, 神经网络模型的效果普遍比多元线性回归模型好; 增加输入数据的时间精度能显著地提高 PM2.5浓度日均值预报的准确率; 当输入数据的时间精度从一天提高到6小时后, LSTM模型的平均绝对误差从27.39 μg/m3降至20.59 μg/m3, 这种效果的提升在显著变好和显著变差的天气情况下更明显; 华北地区PM2.5浓度分布有明显的时空特征, 第一空间模态为同增同减, 第二空间模态为南北反向; 北京市PM2.5浓度与内蒙古、河北及天津等地区前一天的PM2.5相关。利用CNN-LSTM混合模型学习华北地区PM2.5的时空信息, 能进一步提高北京市PM2.5浓度的预报水平, 使得误差降低至17.36 μg/m3。  相似文献   

9.
针对利用多元线性回归和时间序列模型预测PM2. 5时,存在信息利用不全面和预测精度不高的问题,提出了基于多元时间序列(ARMAX)的PM2. 5预测方法;方法在回归项中引入了PM2. 5影响因子在时间序列上的滞后性阶数,并对残差序列进行信息提取,建立了PM2. 5浓度预测模型;首先通过"天气后报网"采集了合肥市2017年和2018年污染物数据;完成了数据的预处理及相关性分析;分别建立了PM2. 5浓度预测的多元线性回归模型、时间序列模型和ARMAX模型;最后通过RMSE、MAE和Theil不相等系数3个评价指标,将3个模型预测精度进行比较;结果表明:ARMAX模型的预测精度显著高于单一的时间序列模型或多元线性回归模型。  相似文献   

10.
11.
为了提高PM2.5浓度预报准确率,基于长短期记忆(LSTM)神经网络构建多变量混合预报模型(hLSTM),利用空气质量数据、气象数据和日期时间信息对长沙10个空气质量监测站未来24小时PM2.5浓度进行逐小时预报,并对模型精度进行评估。结果表明:hLSTM逐小时PM2.5预报模型误差随预报时效的增加呈现前陡后缓逐步增大,均方根误差(RMSE)、平均绝对误差(MAE)和平均绝对百分比误差(MAPE)分别从1 h的6.53 μg·m-3、4.03 μg·m-3和16.02%增大到24 h的20.62 μg·m-3、13.56 μg·m-3和47.34%;模型误差存在明显的季节性差异,呈现冬季>秋季>春季>夏季的特征;相较于基于决策树(DTs)、循环神经网络(RNN)和普通LSTM的预报模型,hLSTM模型能更好地提取长沙PM2.5浓度数据的时序特征,达到更高的预报精度;利用hLSTM模型对长沙2019年12月13日~16日重污染天气过程PM2.5浓度进行预报,各时效的预报结果均能反映污染过程中PM2.5的变化趋势,其中3 h内的预报结果与观测值吻合程度较高。可见hLSTM可较好提取长沙PM2.5浓度变化特征,为其短临预报提供一种新思路。  相似文献   

12.
利用集合经验模态分解算法(EEMD)和 BP 神经网络组成的混合模型, 对北京城区PM2.5浓度值进行短期预报。结果表明, 与单独使用BP神经网络模型相比, EEMD-BP混合模型的预报准确率更高; 混合模型高频部分的预报误差是整体误差的主要方面; 混合模型的输入变量中需包含输出变量的信息; 前期污染物浓度的数值对模型的预报结果有较大的影响。  相似文献   

13.
针对广西地区PM2.5污染情况,利用广西气象站数据通过反距离加权插值得到广西地区空气质量监测站的气象数据,然后结合空气质量监测站数据及其气象数据插值结果建立地理加权回归张力样条函数(geographically weighted regression-tension splinefunction,GWR-TSF)插值模型,并用该模型进行广西PM2.5浓度插值分析.研究结果表明,GWR-TSF模型的PM2.5浓度插值效果较好,其均方根误差为2.34μg/m3,较普通克里金(ordinary Kriging,OK)模型和地理加权回归(GWR)模型分别提高了20.68%和25.71%;而平均绝对误差为2.13 μg/m3,较OK模型和GWR模型分别提高了20.22%和11.62%,对区域PM2.5监测预警具有一定的参考价值.  相似文献   

14.
应用BP神经网络算法建立高速磨削单位面积法向磨削力的预测模型.对比实验结果和预测值,表明该模型有一定的预测精度,通过增加学习样本或采用改进型的神经网络模型,能够进一步提高预测精度,对于高速超高速磨削研究有一定的帮助.  相似文献   

15.
利用差分整合移动平均自回归模型(ARIMA)、后向传播神经网络(BP)以及长短期记忆神经网络(LSTM),对广州市2015—2019年的PM2.5浓度数据进行训练和预报,研究集合经验模态(EEMD)分解和时间分辨率对不同模型预报准确性的影响.结果表明,EEMD分解可以显著地提升低频分量的预报效果;提高输入数据的时间分辨...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号