首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
针对风电场风速-功率异常数据难以清洗的问题,提出一种基于QM-DBSCAN算法的风电场数据清洗方法.首先选取最能代表风力机运行状况的风速-功率数据作为研究对象,根据异常数据的分布特征进行分类;然后分别利用四分位法、标准DBSCAN算法及基于QM-DBSCAN方法识别和剔除异常数;最后通过spearman系数进一步验证所提方法的有效性.研究结果表明:QM-DBSCAN方法的剔除效果最好,较四分位法和标准DBSCAN法的spearman系数分别提高0.003 5和0.004 7.  相似文献   

2.
针对风电场采集到的历史风速数据中存在异常值的问题,为保证风速数据的准确性和有效性,提出了一种运用差分自回归滑动平均(auto regressive integrated moving average,ARIMA)、小波分解(wavelet decomposition,WD)和隐马尔科夫(hidden Markov model,HMM)组合算法对异常风速数据进行挖掘的方法.采用ARIMA模型挖掘异常风速数据的潜在特征,得到反映风速值异常情况的残差序列;为进一步提高检测精度和降低系统误差的干扰,采用小波分解方法捕获残差序列中的粗大误差特征;借助HMM算法的双重随机过程检测异常风速值并剔除,将剔除异常值后的数据运用粒子群优化最小二乘支持向量机方法进行重构,保证风速序列的完整性.实际算例结果表明了所提方法的有效性和可行性.  相似文献   

3.
为了解决原始的风电机组数据采集与监控系统(SCADA)中包含大量异常记录的数据、难以准确反映机组运行状态的问题,提出了一种带噪声基于密度的空间聚类(DBSCAN)模型的风电机组SCADA异常数据识别方法。该方法从分析风速-功率曲线的特点出发,采用预测误差和分类准确度来选取关键聚类参数邻域半径和邻域最小样本点数,避免了人工确定聚类参数的主观性,且参数选择过程可以完全自动化,实现了风电机组SCADA异常数据的有效识别。通过某风场中风电机组的监测数据进行实例验证,结果表明:所提方法能够在保证异常数据被剔除的前提下,保留尽可能多的正常数据,异常识别效果好于现有的k-dist图法和基于k-平均最近邻算法的改进算法(KANN-DBSCAN)。该研究可为开展风电机组状态分析提供参考。  相似文献   

4.
孙睿藻  魏璐 《河南科学》2023,(3):313-320
在风电功率预测中,风速到风电功率的转换是关键步骤,风功率曲线建模和机器学习等技术都需要高质量的风电功率数据,而风电机组实际运行过程中由于多种因素会导致风功率曲线中出现大量的异常数据.首先分析了河南省洛阳市虎头山风电场风电机组历史运行异常数据分布特征,提出了结合孤立森林(iForest)算法与标准差(σ)检测法的技术对异常数据进行识别,并对比了iForest-σ和σ-iForest两种次序组合方式在异常数据识别过程中的异常数据清洗时间、删除率、准确率.结果表明,iForest-σ和σ-iForest方法都能够有效识别异常数据,iForest-σ方法相对数据删除率低且精度高.上述方法清洗效果好,效率高且不依赖于正常数据进行非监督训练,同时适用于其他研究场景的异常数据清洗工作,具有较强的通用性.  相似文献   

5.
针对准东-华东(皖南)±1100k V特高压直流输电工程线路途径甘肃地区风速特性进行分析,为其线路架设提供依据。首先,采用诺曼诺夫斯基准则对±1100k V特高压直流输电工程线路途径甘肃地区的18个台站2006~2015年10年间的风速数据进行分析处理并剔除异常数据;然后,采用SPSS软件分别对风速数据进行分析,总结得出其变化趋势,接着以温度、沙尘为自变量,风速为因变量进行相关性分析;最后,采用Arc GIS软件绘制18个台站的风速的频率分布图。  相似文献   

6.
风电机组的风速、功率数据是衡量风电机组正常运行的关键参数,然而其中包含大量的异常数据,需要进行清洗。该文提出一种改进的孤立森林算法,先使用四分位法确定孤立森林正常数据评分与异常数据评分的分界线,再划分风速区间改变边缘数据的异常性,最后使用最小二乘法曲线拟合去误差去除小概率离散型和小概率堆积型异常数据的改进方法来对风速、功率的异常数据进行清洗。结果表明:与传统的孤立森林算法相比,改进的孤立森林算法能够正确界定正常数据评分与异常数据评分的分界线,可以去除堆积型异常数据,且对于数据主带边缘的离散型异常数据具有更好的清洗效果。  相似文献   

7.
张昀  李小龙 《江西科学》2020,38(3):293-297,319
针对现有浮动车数据预处理方法中存在算法复杂和精度低等缺点,提出一种基于DBSCAN(DensityBased Spatial Clustering of Applications with Noise)算法的浮动车数据预处理方法。该算法操作简单,仅需原始GPS数据中的纬度和经度就能去除浮动车数据中的轨迹漂移点。首先,在数据库中对浮动车数据进行剔除经纬度越界数据、剔除异常数据、剔除重复数据和剔除不完整数据处理;然后,使用DBSCAN算法剔除浮动车数据中的轨迹漂移点。利用该方法对武汉市浮动车数据进行预处理,能够快速有效去除浮动车数据中的轨迹漂移点。  相似文献   

8.
剔除支持向量回归中异常数据算法   总被引:1,自引:0,他引:1  
定义了回归问题中异常数据及其不满足回归映射关系差异程度的度量,分析了回归问题中理论映射模式与回归估计模式关系,提出并证明了回归问题中逐个剔除异常数据,建立回归估计模式逐步逼近理论模式的逐步逼近定理,并构建了以逐步逼近定理为理论依据的剔除支持向量回归中异常数据算法,理论分析了算法的收敛性和有效性。然后,引入逐步搜索算法改进剔除异常数据算法以解决大规模样本的支持向量回归中异常数据剔除问题,理论分析显示改进算法也是收敛的和有效的。最后,应用给定已知函数生成样本和UCI机器学习数据库样本数据仿真实验,结果显示算法是有效的和鲁棒的。  相似文献   

9.
基于LI-8100A型多通道土壤碳通量测量系统的长期观测资料进行数据质量控制分析,提出一种科学有效的自动化质量控制方法 .采用物理极值范围检验、 1.5倍标准差检验、数据稳定性判据检验和空间一致性检验等方法对多通道土壤CO2通量数据进行质量控制,筛选、甄别出观测过程中不合理的异常数据点并剔除.利用该方法对兰州大学半干旱气候与环境观测站2020年7、 12月的土壤CO2通量原始数据资料进行质量控制分析.结果表明,该方法具有良好的操作性与实用性,可实现计算机程序自动化处理,对异常野点数据的检测效率较高,能有效提高多通道土壤CO2通量数据的准确性、一致性、处理时效和资料质量.  相似文献   

10.
一种多率采样的在线支持向量回归及应用   总被引:1,自引:1,他引:0  
针对应用支持向量回归对不确定控制系统在线建模时精度受异常数据影响的问题,通过分析不同样本分布情况下异常数据的影响,指出增加异常数据邻域的样本密度可以有效地提高建模精度.提出了多率采样的支持向量回归在线建模方法,通过多率采样增加局部样本密度,并利用支持向量回归在小样本学习时的良好性能,构建一种局部样本密集的滚动时间窗,用以减少训练样本数和在线剔除异常数据.将该方法应用于多通道电液力伺服同步加载系统的负荷输出预测,结果表明,与传统单率采样的方法相比,在训练样本只增加2个的情况下,该方法具有更好的鲁棒性和预测精度,预测平均绝对误差达到了0.66%.  相似文献   

11.
为实现短期风电功率的高精度预测,综合考虑风电功率数据波动性以及多维气象数据对风电功率预测的影响,提出了一种基于改进熵权法和SECEEMD的短期风电功率组合预测方法。首先,提出了一种综合相关性分析模型,结合多种特征选择方法对多维气象特征实现综合评价,准确筛选与风电功率相关性较高的气象特征,提高预测精度。其次,针对CEEMD(Complementary Ensemble Empirical Mode Decomposition,互补集合经验模型模态分解)存在的分解分量过多,模态混叠程度加剧的问题,提出了SECEEMD分解算法,在降低分量数量,降低模态混叠程度的同时,提高模型的训练速度。然后,分别建立NWP-LSTM和SECEEMD-BP预测模型,并通过贝叶斯优化算法优化长短期记忆神经网络和BP神经网络结构;最后,通过改进熵权法寻找到最优权重组合进行加权组合。实验以内蒙古某风电场的风电功率数据和气象数据为实验数据,经验证,本文所提预测模型,能较大程度提高预测精度,相较于一般预测模型,R2-Score分别提高了4%和0.6%,MAE分别降低了44%和1.1%,证明本文所提风电功率预测方法具有更高的预测精度和更快的训练速度,更加适合进行风电功率预测。  相似文献   

12.
 针对风电场风功率预测所需的离地70m、0~4h的超短期风速预报,本文利用中央气象台发布的MM5格点输出的数值预报风速及测风塔实时发回的气象资料,探讨了利用神经网络将前期误差观测值和测风塔湍流指标等因子对MM5数值预报风速进行动态修订的方法,建立动态修订超短期预报模型,为满足风电场超短期风功率预报的工程应用提供一定的参考。结果表明,修订后的预报风速平均绝对误差等指标大幅降低,有效地提高了预报精度。  相似文献   

13.
 对风电场风速和风电功率预报进行客观准确的评判,可以有效促进风电场风速和风电功率预报水平的提升,为减缓风电并网对电网的影响服务.本文在对风电场风速和风电功率预报准确率评判方法进行全面回顾的基础上,分析了常用数学预报准确率评判法、相对于风电场额定值的预报准确率评判法、等级预报准确率评判法和与风力发电特征紧密结合的风电场风速预报准确率评判法.同时还分析了这4类风电场风速和风电功率预报准确率评判方法的特质,及其与风力发电特征的结合程度和适用范围.  相似文献   

14.
利用江西省2019年3月~2020年2月气象站观测资料,在小时尺度上,对中国气象局下发的智能网格实况的2 m气温、湿度、风速、降水等多个气象要素产品进行检验评估.研究分析各类产品的数据误差及其时空变化规律,验证该产品在研究区的适用性.研究结果表明:2 m气温、相对湿度产品与站点观测较为一致,其相关系数均可达0.9以上,2 m气温均方根误差在1.0 ℃左右,准确率可达80%以上,相对湿度均方根误差小于10%,准确率可达90%以上.风速产品的数据精度较低,相比站点观测风速明显偏弱,70%站点的风向准确率小于50%,风向准确率仅为40%左右.降水产品能准确反映年内逐小时变化趋势,但存在一定程度低估,相关系数基本在0.8以上,平均误差为-0.1~0.1 mm·h-1,平均绝对误差小于0.2 mm·h-1.与站点观测相比,降水产品对强降水明显偏弱.地形对实况网格产品准确性有较大影响,产品误差在地形复杂山区中比在平原地区中明显偏大.总体上,2 m气温、相对湿度产品质量较高,基本可满足业务服务需求.风速产品及降水产品在大降水量级下的误差较大,与业务服务需求有一定差距.  相似文献   

15.
选取广西1971~2015年91气象站点风速数据,辅以DEM与遥感本底信息数据,运用气候学方法和指数空间推算法,构建广西不同时间尺度的风速资源空间分析模型,模拟广西近地层年均、季度风速,利用交叉验证法进行对比验证,选出较高精度的模拟结果,分析广西风速资源时空分布特征。研究结果表明,基于指数空间推算法的风速空间分析模型,综合考虑海拔高度及下垫面类型等因素的影响,可模拟精度较高的风速资源分布情况。广西近地表风能资源丰富区主要位于钦州市、防城港市、北海市等沿海一带以及由大山脉的主脉与周围大片谷地构成的地形区,且该区域春季风速较高,冬季次之,秋夏季最低。  相似文献   

16.
以提高风力机发电效率为目标,对风机功率曲线的工作点及可优化区间进行分析,为功率曲线优化提供基础。根据风力机的监测数据,采用最小二乘法与查表法估算出最优功率曲线,将其与叶尖速比法结合,调整风力机内部参数,以进行功率曲线优化。该方法利用实际的中小型风力机机进行试验,克服了叶尖速比法需要建立准确风力机模型及风速测量等在实际生活中应用的局限性;并对单台风力机建立模型,理论输出功率精度高,具有很高的自适应性。通过对多台风力机功率曲线的对比分析,发现该方法对优化风力机的功率曲线具有一定效果,可为中小型风力机的优化提供参考。  相似文献   

17.
根据风力机数学模型,分析最大风能捕获的运行点条件,推导最佳叶尖速比的计算表达式.运用曲线拟合方法拟合得到误差数据条件下的最佳叶尖速比的参数,间接计算得到最佳叶尖速比.算例显示拟合值准确度较高.研究工作为计算风电机组最佳叶尖速比提供新的曲线拟合方法.  相似文献   

18.
研究并提出了一种故障风机损失发电量估计方法。该方法对故障风机的风速进行估计,结合风机的实际输出功率曲线给出故障风机故障期间损失发电量的估计值。在风速估计方面引入了相关性分析,选取与故障风机风速强线性相关的正常运行风机,对其风速应用回归分析方法获取故障风机风速的估计值。在估计方法的基础上,还给出了该方法在风机监控系统中的一个实现,并对估计效果进行了验证分析。  相似文献   

19.
针对风速的波动性导致风电功率不稳定,严重影响电力系统的安全、稳定运行等问题,提出一种基于风速数据分解的组合式模型,该模型首先利用集合经验模态分解法将风速序列分解为频率不同的若干个分量,降低了风速序列的非平稳性。然后利用花朵授粉算法优化BP(back propagation)神经网络构建预测模型,预测各个分量的变化趋势。最后将各个分量的预测值进行叠加组合得出最终的风速预测值。仿真结果表明,所提出的组合式模型平均绝对误差控制在0.2 m·s~(-1)以内,在风速预测方面有较高的预测精度,具有广阔的实际应用前景。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号