摘 要: | 为进一步提高气象数据质量控制的灵活性和准确度,选取2019—2021年福州市国家观测站点采集的气象数据,以气温数据的质控为例,引入轻量级梯度提升算法LightGBM,挖掘并利用气象要素之间的相关关系进行数值预测,综合考虑查全率和查准率,最终检测出异常点,并与传统的变化率判断法进行结果对比。结果表明,(1)针对四种典型的时间序列异常情况,LightGBM算法能检测出气温数据中的异常值,与变化率判断法相比,其质控的准确性高、效果好;(2)通过P-R曲线评估算法性能,发现基于LightGBM的质控方法泛化能力更好;(3)综合考虑查全率和查准率,LightGBM算法阈值选取更精确、针对性强、灵活性高。
|