首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 343 毫秒
1.
k-prototypes是处理包含数值属性和分类属性混合数据主要的聚类算法,但由于对初始点的随机选择极易使聚类结果陷入局部最优,导致聚类结果的偏差.为改善聚类结果对初始点的依赖,采用遗传算法对初始点进行全局最优搜索.改进后的方法有更高的稳定性和对大数据集更快的收敛速度.数据集仿真结果表明改进算法正确、有效.  相似文献   

2.
为数据集选择合适的聚类算法是获得高质量聚类结果的前提和保障.提出了基于有效性指标的聚类算法选择方法,通过对不同聚类算法的聚类结果的质量评价为数据集选择最适合的聚类算法.该方法的优点是在对数据集的情况了解甚少的情况下,也能有效地保障聚类质量.实验结果表明本文方法十分有效,为实验数据集正确选择出最适合的聚类算法,并获得了高质量的聚类结果.  相似文献   

3.
在研究零售户聚类分析中,传统的k中心聚类方法,计算成本过大,无法有效应用子大数据集.提出了零售户聚类方法,继承CLARANS算法迭代思想,采用全局随机抽样技术,将算法应用于大型空间数据集,通过多次迭代尽量寻求最优聚类结果.聚类结果的评价标准为基于最短主干道距离(SARD)的总距离.该聚类算法是在CLARANS算法的基础上进行改进,使其能够处理带地理信息的数据对象,且聚类结果满足需求约束条件限制.  相似文献   

4.
一种基于聚类树的增量式数据清洗算法   总被引:2,自引:0,他引:2  
研究了在数据模式与匹配规则不变的前提下 ,数据集动态增加时近似重复记录的识别问题 ,提出了一种基于聚类树的增量式数据清洗算法IACT .该算法通过构建聚类树先对记录进行分区 ,然后在划分的区域内进行相似度的计算识别出近似重复记录 ,从而完成了增量式相似重复记录的检测 .实验结果证明了IACT算法在无损精度的情况下 ,在效率上优于多趟邻近排序 (MPN)算法 .  相似文献   

5.
针对风电场风速-功率异常数据难以清洗的问题,提出一种基于QM-DBSCAN算法的风电场数据清洗方法.首先选取最能代表风力机运行状况的风速-功率数据作为研究对象,根据异常数据的分布特征进行分类;然后分别利用四分位法、标准DBSCAN算法及基于QM-DBSCAN方法识别和剔除异常数;最后通过spearman系数进一步验证所提方法的有效性.研究结果表明:QM-DBSCAN方法的剔除效果最好,较四分位法和标准DBSCAN法的spearman系数分别提高0.003 5和0.004 7.  相似文献   

6.
针对电网中录波型故障指示器上传的海量故障数据存在着大量的重复、干扰、错误及无效波形,提出一种基于稀疏自编码(sparse auto-encoder,SAE)的故障数据聚类清洗方法,该方法首先利用稀疏自编码对故障数据进行特征学习与降维,继而用主成分分析(principal component analysis,PCA)对降维后数据再次进行降维提取,实现对不同故障数据的特征获取;最后利用基于密度峰快速搜寻聚类算法(clustering by fast search and find of density peaks,CFSFDP)对故障特征进行聚类,实现对重复、干扰、错误等故障数据的聚类清洗和真实故障数据推送.提出的海量故障数据聚类清洗方法,达到了对不同类型故障数据进行清洗去冗的效果,为故障告警智能推送提供了技术支撑,提高了运维人员获取准确故障信息的效率.  相似文献   

7.
针对离散制造业质量管理系统中维度高,且存在较多一致性数据的情形,设计了一种基于信息论中的信息熵,即互信息的改进聚类算法。通过实验分析,采用改进的聚类算法可有效提高聚类的正确率,并且通过演化聚类理论和方法的应用可对离散制造业质量管理提供有效的决策参考信息。  相似文献   

8.
一种确定最佳聚类数的新算法   总被引:1,自引:0,他引:1  
针对K-均值聚类算法需要事先确定聚类数K的问题,将粒度计算引入样本相似度函数,定义了新的样本相似度,用模糊等价聚类确定数据集可能的最大类簇数Kmax.以Kmax为搜索上界,利用改进全局K-均值聚类算法,以BWP(Between-Within Proportion)为聚类有效性度量指标,提出确定最佳聚类数的一种新方法.通过UCI机器学习数据库数据集以及随机生成的人工模拟数据集实验测试,证明该算法不仅能有效确定数据集的最佳聚类数,而且适用于大规模数据集,但是会受到噪音点影响.  相似文献   

9.
为解决企业客户价值体现问题, 提出一种TFA客户细分改进模型, 以客户发展空间T、 购买频次F和平均购买额A为指标, 充分体现客户的价值和发展空间. 首先, 引入局部密度值ρ和信息熵H, 改进K-means聚类算法, 以优化传统K-means聚类方法初始聚类中心的选取问题;其次, 通过搭建机器学习框架, 对选取人工数据集及真实数据集进行聚类实验, 验证模型的有效性. 实验结果表明, 该模型能有效分类客户, 充分反映客户价值及其发展空间, 并通过改进聚类算法提升了算法效率.  相似文献   

10.
针对入侵检测中少数类异常数据的检测精度较低的问题,提出基于支持向量聚类的不平衡数据无监督检测算法.方法采用支持向量聚类对所有未知样本进行聚类,根据不同类别样本内在属性的差异,用改进的重抽样方法选择样本,平衡数据集的分布,对新的数据集进行学习.经过KDD99的测试表明,该方法能有效检测出少数类样本.  相似文献   

11.
针对风力发电机组变桨系统故障诊断模型参数难以优化问题,提出了基于状态转移算法优化多类最优间隔分布机(multi-class Optimal Margin Distribution Machine optimized by the State Transition Algorithm,mcODM-STA)的风电机组变桨系统故障诊断方法.该方法选择风电机组功率输出作为主要状态参数,利用Pearson相关系数对风电数据采集与监视控制系统中风电机组历史运行数据进行相关性分析,剔除与功率输出状态参数相关性较低的特征,对余下特征进行二次分析,减少样本特征.将数据集分为训练集和测试集,训练集用来训练所提故障诊断模型,测试集用来进行测试.利用国内风电场实际运行数据进行实验验证.实验结果表明,与其他多种参数优化方法相比,所提方法故障诊断准确率和Kappa系数更高.  相似文献   

12.
风电场风速功率数据中通常包含大量异常数据,难以反映风机的真实工作情况,影响风电功率预测的准确性,进而造成一定的经济损失.针对该问题,分析异常数据的特征,提出滑差-四分位异常数据剔除方法,并利用高次多项式和Logistic函数对剔除后的数据进行风速-功率曲线建模,最后用和方差、均方根误差和确定系数验证该方法的适用性和有效性.实例分析表明,该方法简单高效、通用性强,可显著提高风电机组功率特性分析的准确度.  相似文献   

13.
随着风电渗透率的不断增大,并网风电场的机端电压稳定面临巨大挑战。研究了风电场内部各节点的无功电压特性,提出一种基于机组有功出力聚类分区的无功电压优化控制策略:通过 自动电压控制系统获取风电场当前的电压指标与实际运行数据,计算出风电场的无功需求;以历史有功出力数据对场内机组进行模糊C聚类分区;利用改进的粒子群算法寻找最优无功分配方案,对每一区域进行无功电压控制。在MATLAB上进行仿真,与传统根据各机组无功容量进行分配的方案进行对比,仿真结果表明,所提控制策略能够有效改善风电场并网点电压控制性能,减小风电场内机组机端电压的波动。  相似文献   

14.
为有效抑制由随机风、浪载荷引起的海上浮式风电机组发电功率波动,提出了变桨距线性自抗扰控制(LADRC)策略。综合考虑气动力、水动力、结构弹性和变桨距控制等影响因素,建立5 MW级海上浮式风电机组气弹水控耦合系统动力学模型,基于恒转矩控制目标设计变桨距线性自抗扰控制器,分别采用带宽整定法和BP神经网络整定法对控制器参数进行整定,对比分析变桨距线性自抗扰控制对发电功率波动的抑制效果。研究结果表明:采用带宽整定和BP神经网络整定的变桨距线性自抗扰控制可以有效地改善海上浮式风电机组变桨距灵敏度,抑制发电功率波动。  相似文献   

15.
为了改善风电机组的恒功率输出区域的动态性能,提出了一种基于改进自抗扰控制器的变桨控制策略。当风速高于额定风速时,通过调节桨距角改变风机气动转矩,保证风机输出功率的稳定性。设计了一个改进的连续光滑的非线性函数,可有效提高系统的抗扰动能力。基于该非线性函数对传统自抗扰控制器做出了改进。仿真结果证明,改进自抗扰控制器的变桨距控制系统能够对桨距角进行精确调整并将输出功率快速稳定到额定值附近,具有较快的响应速度及较好的抗扰动能力。  相似文献   

16.
为应对近年来国内风电渗透率不断增加、大量清洁能源并入电网给日前电价预测带来的挑战,提高高比例风电接入情况下电力市场短期电价预测精度,本文将高比例风电情况下的风电出力与负荷数据进行融合得到了一项改进的输入特征变量,代表风电与负荷共同对电价的影响程度。采用最大信息系数法分析各特征变量与电价之间的相关性,并结合长短期记忆神经网络(Long-short Term Memory, LSTM)与注意力机制(Attention)的特点构建了LSTM-Attetion预测模型,然后对不同输入条件下的预测结果进行对比分析,数据结果显示,引入该输入特征变量后模型的预测精度都有明显提升。经过进一步算例实验后表明,本文所提出的特征变量相比风荷比而言更能能够有效提高高比例风电情况下电价预测精度,适用于许多经典算法。  相似文献   

17.
随着新能源并网进程的推进,风电装机规模逐年扩大。受区域内天气变化影响,风机出力的间歇性和波动性特征对电网的威胁亦越发显著。极端天气所引发的风电出力异常爬坡事件,易导致电网功率失衡,对电力系统机组调度、源荷平衡造成了极大压力。合理的风电爬坡事件检测以及精准的风电功率预测能为风电场运维及电力系统调度提供先验指导,有力缓解风电不确定性带来的危害。首先讨论了目前主流风电爬坡事件定义的盲点,分类并分析了3种风电爬坡场景的功率变化特性,据此提出基于滑动窗双边累计和(cumulative sum, CUSUM)算法的风电爬坡事件检测方法,提取时序耦合信息,捕捉短时间窗口内风电功率数据的异常波动,提高风电爬坡事件检测精度。其次,采用贝叶斯优化的长短期记忆(long short term memory, LSTM)神经网络,最优化模型超参数,提高模型对于爬坡事件发生时风机出力的预测性能。进一步应用所提风电爬坡事件检测方法,对模型预测区间内的风电爬坡事件进行检测实验,验证了所提方法的有效性。  相似文献   

18.
对风机参与电力系统调频的控制策略进行研究,提出一种基于模糊规则的风机超速区变参数综合惯性控制方法.首先,分析风机传统综合惯性控制方法,针对电网频率的二次跌落问题,对风机超速状态下的惯性响应特性进行研究,使风机具有更好的转速恢复能力;然后,针对风机实际运行状态与惯性控制系统参数间的动态匹配问题,以频率差值和频率变化率为考量标准,制定模糊规则,实现风机惯性控制更优的动态响应,并进一步减小电网频率的二次跌落.仿真实验表明:文中方法具有可行性和有效性.  相似文献   

19.
在风电机组现场运行大数据基础上,提出了一种互信息关联分析的风电机组输出功率建模方法;并基于该模型对风机叶片加装涡流发生器前后风电机组的性能进行了评估分析。计算验证结果表明:所建模型能够较好的拟合机组的输出功率;同时在叶片前缘附件加装涡流发生器,可以有效的改善机组的发电性能,提升风机对风能的利用率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号