首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
风电场风速功率数据中通常包含大量异常数据,难以反映风机的真实工作情况,影响风电功率预测的准确性,进而造成一定的经济损失.针对该问题,分析异常数据的特征,提出滑差-四分位异常数据剔除方法,并利用高次多项式和Logistic函数对剔除后的数据进行风速-功率曲线建模,最后用和方差、均方根误差和确定系数验证该方法的适用性和有效性.实例分析表明,该方法简单高效、通用性强,可显著提高风电机组功率特性分析的准确度.  相似文献   

2.
风电机组的风速、功率数据是衡量风电机组正常运行的关键参数,然而其中包含大量的异常数据,需要进行清洗。该文提出一种改进的孤立森林算法,先使用四分位法确定孤立森林正常数据评分与异常数据评分的分界线,再划分风速区间改变边缘数据的异常性,最后使用最小二乘法曲线拟合去误差去除小概率离散型和小概率堆积型异常数据的改进方法来对风速、功率的异常数据进行清洗。结果表明:与传统的孤立森林算法相比,改进的孤立森林算法能够正确界定正常数据评分与异常数据评分的分界线,可以去除堆积型异常数据,且对于数据主带边缘的离散型异常数据具有更好的清洗效果。  相似文献   

3.
孙睿藻  魏璐 《河南科学》2023,(3):313-320
在风电功率预测中,风速到风电功率的转换是关键步骤,风功率曲线建模和机器学习等技术都需要高质量的风电功率数据,而风电机组实际运行过程中由于多种因素会导致风功率曲线中出现大量的异常数据.首先分析了河南省洛阳市虎头山风电场风电机组历史运行异常数据分布特征,提出了结合孤立森林(iForest)算法与标准差(σ)检测法的技术对异常数据进行识别,并对比了iForest-σ和σ-iForest两种次序组合方式在异常数据识别过程中的异常数据清洗时间、删除率、准确率.结果表明,iForest-σ和σ-iForest方法都能够有效识别异常数据,iForest-σ方法相对数据删除率低且精度高.上述方法清洗效果好,效率高且不依赖于正常数据进行非监督训练,同时适用于其他研究场景的异常数据清洗工作,具有较强的通用性.  相似文献   

4.
针对风电场采集到的历史风速数据中存在异常值的问题,为保证风速数据的准确性和有效性,提出了一种运用差分自回归滑动平均(auto regressive integrated moving average,ARIMA)、小波分解(wavelet decomposition,WD)和隐马尔科夫(hidden Markov model,HMM)组合算法对异常风速数据进行挖掘的方法.采用ARIMA模型挖掘异常风速数据的潜在特征,得到反映风速值异常情况的残差序列;为进一步提高检测精度和降低系统误差的干扰,采用小波分解方法捕获残差序列中的粗大误差特征;借助HMM算法的双重随机过程检测异常风速值并剔除,将剔除异常值后的数据运用粒子群优化最小二乘支持向量机方法进行重构,保证风速序列的完整性.实际算例结果表明了所提方法的有效性和可行性.  相似文献   

5.
利用ECWMF集合数值天气预报结果,针对风电场风速预报、风功率预测,对比分析分位回归、K值近邻及其集成预测方法,根据风速波动特征对集合数值预报成员进行动态检验筛选,筛选出的预报成员再进行分位回归概率区间预测。结果表明与单一分位回归方法相比,基于K值近邻的分位数回归效果显著提升,相关性从原有0.59~0.68提升至0.63~0.82,提升了0.04~0.2,均方根误差从2.44~2.59m/s减少至1.95~2.39m/s。利用"风速-功率"实测数据分段统计得到风功率曲线,与传统算法相比,风功率准确率从81%提升至81.3%,合格率从84.3%提升至84.8%,风速变换到功率的相关性略降,为0.75。基于K值近邻的分位数集成方法,其风速预测基本包罗功率的波动区间,该方法对改善基于单一数值天气预报的风功率预测,指导意义明确、效果明显,在其他风电场的数值天气预报中验证取得一定的效果。  相似文献   

6.
张昀  李小龙 《江西科学》2020,38(3):293-297,319
针对现有浮动车数据预处理方法中存在算法复杂和精度低等缺点,提出一种基于DBSCAN(DensityBased Spatial Clustering of Applications with Noise)算法的浮动车数据预处理方法。该算法操作简单,仅需原始GPS数据中的纬度和经度就能去除浮动车数据中的轨迹漂移点。首先,在数据库中对浮动车数据进行剔除经纬度越界数据、剔除异常数据、剔除重复数据和剔除不完整数据处理;然后,使用DBSCAN算法剔除浮动车数据中的轨迹漂移点。利用该方法对武汉市浮动车数据进行预处理,能够快速有效去除浮动车数据中的轨迹漂移点。  相似文献   

7.
为了解决原始的风电机组数据采集与监控系统(SCADA)中包含大量异常记录的数据、难以准确反映机组运行状态的问题,提出了一种带噪声基于密度的空间聚类(DBSCAN)模型的风电机组SCADA异常数据识别方法。该方法从分析风速-功率曲线的特点出发,采用预测误差和分类准确度来选取关键聚类参数邻域半径和邻域最小样本点数,避免了人工确定聚类参数的主观性,且参数选择过程可以完全自动化,实现了风电机组SCADA异常数据的有效识别。通过某风场中风电机组的监测数据进行实例验证,结果表明:所提方法能够在保证异常数据被剔除的前提下,保留尽可能多的正常数据,异常识别效果好于现有的k-dist图法和基于k-平均最近邻算法的改进算法(KANN-DBSCAN)。该研究可为开展风电机组状态分析提供参考。  相似文献   

8.
卡尔曼滤波修正的风电场短期功率预测模型   总被引:8,自引:0,他引:8  
针对数值天气预报模型输出的气象参数存在系统误差而导致风电场功率预测精度受到制约的问题,提出了一种基于卡尔曼滤波修正的风电场短期功率预测模型.使用卡尔曼滤波算法对数值天气预报输出的风速数据进行动态修正,并结合其他气象数据形成新的用于风电功率预测的修正气象数据集合;根据原始气象数据和修正气象数据这2个训练集分别建立了风电场功率输出的原始神经网络、修正神经网络的预测模型.经同一时间区间内的实测数据与模型分析数据的对比分析表明:通过卡尔曼滤波修正的风速数据能够很好地跟踪实际风速数据的变化趋势,平均误差与绝对平均误差比较小;所提模型能够显著降低预测结果的均方根误差,使其从未修正前的17.73%降低至11.32%,证明预测精度得到了明显提高.  相似文献   

9.
针对风力机异常功率数据难以有效清洗的问题,提出改进的DBSCAN方法.首先将数据集离散分割,然后在各离散区间内自适应粗估DBSCNA算法参数并聚类,最后计算统计特征相似性修正聚类结果.以某风场2.5 MW风力机SCADA系统实测数据验证所提方法,结果表明:改进方法的召回率为97.97%,准确率为97.97%,F1值可达97.85%,可有效清洗风力机功率数据集,且变更数据集时改进方法结果更稳定.  相似文献   

10.
针对风电场输出功率预测受气象因素不确定性和异常历史数据的影响而出现的预测结果精度不高的问题,提出基于关联规则及BP(back propagation)神经网络的风电场输出功率预测方法.对异常和缺失数据进行处理,采用改进K-means聚类算法对温度/风速气象数据进行聚类分析,使用Apriori算法挖掘风电场输出功率与气象因素间的关联规则,将关联规则应用于BP神经网络.将4种方法的预测误差进行对比,结果表明:相对其他3种方法,该文方法的最大相对误差、最小相对误差、平均相对误差均最小;其最大相对误差不超过5.78%,最小相对误差仅为0.01%.因此,该文方法能提高风电场输出功率预测的准确度,具有有效性.  相似文献   

11.
基于网格和密度的随机样例的聚类算法   总被引:2,自引:0,他引:2  
为提高密度聚类算法效率并处理非空间属性约束,提出了基于网格和密度的聚类算法(GDRS).它使用网格区域表示点的邻域,非空间属性被分为数值和字符类型.首先通过网格方法找到能准确反映数据空间几何特征的参考点;然后随机选择没有分类的参考点,并测试其邻域的稀疏状况、与其他聚类的关系以及非空间属性的约束来决定加入、合并聚类或形成新的聚类;最后把参考点映射回数据.把此算法和DBSCAN及DBRS算法进行了理论比较,并使用合成和真实数据集对GDRS和DBSCAN进行了对比.实验表明,GDRS具有密度算法的优点,即可发现各种形状的聚类并能屏蔽噪声点,且执行效率明显优于密度算法.  相似文献   

12.
基于改进DBSCAN算法的激光雷达车辆探测方法   总被引:1,自引:1,他引:0  
结合车辆行驶的实际环境,提出了一种基于改进DBSCAN快速聚类算法的激光雷达车辆探测方法.建立激光雷达与摄像机传感器坐标与车辆坐标之间的转换模型,进行数据融合,通过改进DBSCAN算法对雷达数据进行去噪声和聚类处理,根据车辆在激光雷达探测中的形状特征模型进行形状匹配,实时完成车辆探测,并将探测结果投影至图像上.实车实验结果证明,改进的DBSCAN算法在车辆探测应用中具有良好的准确性和实时性.  相似文献   

13.
为有效改善基于密度的聚类算法的聚类效果,提出了判定顺序聚类算法的聚类合理性的形式判据,简述了其神经生物学证据,并据此给出了可有效改善DBSCAN算法的聚类精度和时间效率的新算法DBSCANJZPoll.该算法首先以随机处理次序多次执行一个顺序依赖的子进程;再根据子进程的各次执行结果,由“合理聚类”的形式判据和简单的统计原则确定最终聚类结果.在聚类精度方面,仿真实验表明,DBSCANJZPoll可有效处理密度不均匀的样本集,聚类效果显著优于DBSCAN.在时间效率方面,理论分析表明,对于中高维样本集,DBSCANJZPoll的时间复杂性渐近于O(N),优于DBSCAN算法族中其他算法至少O(N log N)的复杂性;对于低维样本集的仿真也表明, DBSCANJZPoll具有相对优化的时间效率.  相似文献   

14.
考虑对象方向关系的密度聚类算法   总被引:2,自引:0,他引:2  
 聚类分析是数据挖掘的一个重要研究方向.为了在大规模空间数据库中发现任意形状的聚类,Martin Ester等提出基于密度的聚类算法DBSCAN.针对DBSCAN处理聚类边界对象的不足,提出了聚类时考虑对象方向关系的改进算法,实验表明,改进算法在不改变时间、空间复杂度的情况下能得到更好的聚类结果.  相似文献   

15.
针对机载激光雷达建筑物点云提取过程中自动化提取困难,以及提取后的建筑物单体化过程烦琐等问题,提出一种基于密度噪声应用空间聚类(density-based spatial clustering of applications with noise,DBSCAN)算法的机载雷达建筑物点云提取与单体化的方法.该方法对预处理后...  相似文献   

16.
2.4 m×2.4 m风洞为多变量耦合系统,根据运行数据无法直接获得单个操纵变量对输出的影响.因此,提出采用多变量阶跃响应方法辨识风洞系统两输入-两输出耦合参数模型,采用三次样条插值法对阶跃响应数据进行滤波处理,再计算出单个通道的阶跃响应数据,在此基础上使用面积法获得各个通道的传递函数模型,并通过对不同阶次模型输出的均方根误差的比较,实现最佳模型阶次的选择.仿真及风洞现场测试结果验证了本文方法的有效性.  相似文献   

17.
一种基于密度和网格的高效聚类算法   总被引:1,自引:0,他引:1  
聚类已成为数据挖掘的主要方法之一,能够帮助人们在大量的数据中发现隐藏信息.目前最具典型的密度聚类算法是DBSCAN(density-based spatial clustering of applications with noise),它能够在空间数据库中很好地发现任意形状的簇并有效地处理噪声,但是它的计算复杂度相对较大.因此,采用划分数据集和聚簇合并方法,提出了一种基于密度和网格的高效聚类算法DGCA,并通过人工合成数据集和真实数据集对该聚类算法进行理论验证.实验结果表明该算法在效率性能和质量方面比DBSCAN都得到了提高.  相似文献   

18.
针对现有的基于离散小波变换(DWT)去风廓线雷达地杂波技术中最佳分解层数与阈值不好确定,且DWT不具有平移不变性的问题,介绍静态小波变换(sWT)的提升实现方法,提出一种基于提升SWT的风廓线雷达地杂波抑制方法。这种方法通过计算各层小波系数上的2阶原点矩来确定最佳分解层数,并以最邻近地杂波频段的2个频段的平均值作为阈值。由于采用提升实现方式,其运算量相对于传统的基于DWT去地杂波的方法并没有很大的提高,且能适用于较低杂信比的情况。仿真结果验证算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号