基于孤立森林和标准差检测法的风电功率异常数据清洗 |
| |
引用本文: | 孙睿藻,魏璐.基于孤立森林和标准差检测法的风电功率异常数据清洗[J].河南科学,2023(3):313-320. |
| |
作者姓名: | 孙睿藻 魏璐 |
| |
作者单位: | 1. 中国气象局河南省农业气象保障与应用技术重点开放实验室;2. 河南省风能太阳能气象工程研究中心;3. 河南省气象服务中心 |
| |
基金项目: | 国家自然科学基金(42205038); |
| |
摘 要: | 在风电功率预测中,风速到风电功率的转换是关键步骤,风功率曲线建模和机器学习等技术都需要高质量的风电功率数据,而风电机组实际运行过程中由于多种因素会导致风功率曲线中出现大量的异常数据.首先分析了河南省洛阳市虎头山风电场风电机组历史运行异常数据分布特征,提出了结合孤立森林(iForest)算法与标准差(σ)检测法的技术对异常数据进行识别,并对比了iForest-σ和σ-iForest两种次序组合方式在异常数据识别过程中的异常数据清洗时间、删除率、准确率.结果表明,iForest-σ和σ-iForest方法都能够有效识别异常数据,iForest-σ方法相对数据删除率低且精度高.上述方法清洗效果好,效率高且不依赖于正常数据进行非监督训练,同时适用于其他研究场景的异常数据清洗工作,具有较强的通用性.
|
关 键 词: | 风功率数据 异常数据识别 孤立森林算法 标准差检测法 |
|