首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
为解决传统窃电检测方法的局限性,提出一种基于层次分析法的加权力线(LOF)窃电检测方法。该方法首先通过对窃电现象的系统分析,提出新的用电特征指标,构建合理的窃电嫌疑评价体系;其次针对各电气指标数据异常所能代表窃电的不同概率,采用层次分析法合理量化各电气指标的权重,并结合加权LOF算法对海量用户数据进行加权离群分析,使用综合离群因子表征用户窃电嫌疑程度。最后通过实测数据验证,结果表明所提检测方法相较传统LOF算法在较低检测率时能够挖掘出更多的窃电用户,进而提升采集系统的窃电检测效率。  相似文献   

2.
针对目前异常用电检测中存在的专变用户窃电率高、窃电模式难以察觉、使用窃电检测模型查找窃电用户过程中训练集不足的问题,提出了一种基于用电特征分析的无监督方式异常用电检测方法.该检测方法引入离群点查找算法,量化了海量数据中不同异常用电行为,将其提取为异常用电特征序列,并且根据专变用户不同计量方式和用电特点,构建了基于局部离群因子(local outlier factor, LOF)检测算法的用电不平衡特征序列,定义了考虑失压持续时间的电压异常特征序列和基于每日电流曲线聚类结果的电流异常特征序列,设计了异常用电评价流程,提出异常用电检测方法.通过实例验证了此检测方法能够完全甄别存在异常用电行为的用户,且检测方法对窃电时刻预测结果较为准确,其查准率和召回率的调和均值F_1值为0.81.该方法能为企业提供异常行为发生的时间段,为窃电行为的及时调查提供有力的依据.  相似文献   

3.
针对基于栈式自编码器的离群点(SAE)检测算法和基于密度的离群点(LOF)检测算法检测精度不高的问题,提出了将SAE算法和LOF算法相结合的SAE-LOF算法.该算法的核心是对单独的SAE算法和LOF算法加入"投票"思想,通过神经网络训练权重,计算SAE算法和LOF算法加权投票结果,进而检测离群点.首先,训练并测试SAE,得到SAE的重构误差;其次,通过LOF算法得到局部离群因子;再次,将SAE算法的重构误差和LOF算法的局部离群因子作为新的特征输入到神经网络,进行有监督的训练;最后,将测试集分别经过SAE算法和LOF算法,再输入到神经网络,输出值最高的若干样本被预测为离群点.将SAE-LOF算法与SAE算法、LOF算法、KNN算法、孤立森林算法进行了比较,结果表明:SAE-LOF算法的预测结果具有更高的精度、更低的错误率以及更高的AUC值.该算法显著提高了分类器的性能.  相似文献   

4.
针对传统的基于密度的局部离群点检测算法对原始数据集没有进行预处理导致该算法在面对未知数据集时检测效果不理想,又由于其需要计算每一个数据点的离群因子,在数据量过多时,计算量大大增加的问题,通过对局部离群点检测算法的分析,提出了一种基于目标函数的局部离群点检测方法FOLOF(FCM objective function-based LOF).首先,使用肘部法则确定数据集的最佳聚类个数;然后,通过FCM的目标函数对数据集进行剪枝,得到离群点候选集;最后,利用加权局部离群因子检测算法计算候选集中每个点的离群程度.利用该方法在人工数据集和UCI数据集上进行了相关实验,并与其他相关方法进行了对比,结果显示,该算法能够提高离群点检测精度,减少计算量,有效提高离群点检测性能.  相似文献   

5.
在详细分析窃电用户用电特性的基础上,搭建了用于处理海量用电数据的分布式存储Hadoop平台,分析和改进了适用于并行处理的BP神经网络算法,进而提出了基于人工神经网络的窃电嫌疑分析模型.根据窃电行为将会导致的用电异常数据,以及参考供电行业同业经验,选取了影响窃电嫌疑系数的十二个指标.结合窃电嫌疑分析模型,分析得出无窃电嫌疑、一般窃电嫌疑和重大窃电嫌疑三种情况.最后结合实例对该模型的精确度进行验证.  相似文献   

6.
目前的窃电手段隐蔽性强、种类多样,传统的窃电检测方法已经越来越力不从心,不仅准确率低且时效性不高.因此,结合机器学习的方法,提出了一种基于RBF神经网络的窃电行为检测方法.通过对目前常见的窃电方式进行分析,挑选出三相电压中各相电压之间的差值、三相电流中各相电流的差值以及功率因数等参考量作为窃电检测的特征指标,并采用包含特征指标的历史数据来构建基于RBF神经网络的窃电行为检测模型.试验结果表明该方法针对目前常见的窃电方式进行识别的准确率达到94.1%,可以有效地筛选出存在窃电嫌疑的用户.该方法不仅达到了实际应用的精度要求,而且使反窃电技术更加智能化,变被动防窃电为主动防窃电.  相似文献   

7.
在动态增加的数据库环境下,异常数据挖掘中二次挖掘时需重新计算数据集中所有数据对象的局部离群因子的超高时间复杂度问题,在Ioc LOF算法中得到解决并取得良好效果.当向数据库中同时增加多条数据对象时,其算法时间效率下降很快.本文提出一种新的异常数据挖掘算法,先用改进型OPTICS算法进行聚类,然后调用Inc LOF算法仅对部分受影响的数据对象计算局部离群因子.通过实验结果表明,与传统的Inc LOF算法相比,本文提出的算法在动态增加的数据库实验环境下,不仅算法时间效率得到提高,在异常数据挖掘的精度方面也有一定的优化.  相似文献   

8.
现有配电网连接验证工作将可疑异常值视为具有二元属性的独立个体,因此难以有效识别和验证具有高度内在相关性的局部离群组.针对这一问题,提出了基于AP-LOF离群组检测的配电网连接验证方法.通过引入近邻传播(affinity propagation,AP)聚类方法,将待校验台区用户聚类为多簇,并基于局部离群因子(local outlier factor,LOF)算法对所有簇心进行离群点检测,从而准确识别出台区内的离群组用户.以某电力公司实际用户电压数据进行算例分析,结果证明了AP-LOF算法在配电网连接验证中的适用性和有效性.  相似文献   

9.
针对多模态过程数据密度不规则性提出的一类基于密度的方法,大多是以欧式距离为基础来比较彼此间的相似性,从而检测过程是否发生故障。然而多模态数据密度在较小范围内变化较大,采用欧式距离很难获得全面的数据信息。本文提出了一种新的基于加权距离选择邻居的策略,该策略首先对距离进行合理的加权,再根据新的加权距离重新选择样本点的邻居,能有效地避免数据信息不全面的问题。在仿真实验中,首先通过比较基于传统的欧式距离和基于本文加权距离选取的邻居,说明本文策略的优越性;进而将该策略与局部离群因子(Local Outlier Factor,LOF)结合用于TE过程,对TE过程的仿真结果表明该策略在应用于基于密度的检测方法上获得了的良好效果。  相似文献   

10.
GDLOF:基于网格和稠密单元的快速局部离群点探测算法   总被引:1,自引:0,他引:1  
为了适应高维大规模数据集的稀疏性,解决现有离群点探测算法在运用于高维大规模数据集时计算量以及时间效率均无法令人满意的现状,区别于以往文献中以点的数量作为判断稠密的阈值,在基于密度的局部异常检测算法LOF的基础上,以通过数据集中每一点周围的邻近点的状况作为判别依据,提出了稠密单元和稠密区域的概念以及基于网格和稠密单元的快速局部离群点探测算法.通过证明稠密单元和稠密区域中的点不可能成为离群点,使得算法减少了LOF值的计算量并显著提高效率.实验表明,该算法对于高维大规模数据集具有良好的适用性和有效性.  相似文献   

11.
针对隔离森林(iForest: isolation Forest)算法对局部异常点检测能力较低, LOF(Local Outlier Factor)算法 检测时间较长的问题, 提出了基于瀑布型混合技术的隔离森林算法 iForest-WHT(isolation Forest based on Waterfall Hybrid Technology)。 该算法借鉴瀑布型混合技术思想, 将隔离森林算法作为过滤器, 以分割路径为阈 值判断依据, 将路径小于阈值的数据放入候选异常子集, 继而使用考虑极值影响的改进的 LOF 算法对候选异 常子集进一步精化, 得到更加精确的异常点。 实验结果证明, 该算法能以较高的效率识别局部异常点, 提高了 算法的 F 1 值, 并且降低原 LOF 算法的误检率。  相似文献   

12.
首先介绍了如何通过层次分析法确定某项工作的评定指标,从而可以较为准确的建立指标评定体系.其次,以高校学生数据为例,采用加权标准法,对评定体系的各项指标确定其权重值.最后,通过与传统评定方法对比,分析了科学评定法对高校评定起到了一定的支撑作用.  相似文献   

13.
针对传统检测模型仅通过单一方法进行窃电检测具有局限性且用电数据中存在类不平衡的问题,从集成学习的角度出发,本文提出一种基于熵权法融合异质分类器的窃电检测模型。首先,通过少数类样本合成过采样技术(synthetic minority oversampling technique,SMOTE)处理用电数据不平衡的问题,其次综合考虑个体分类器之间的多样性以及各自的检测性能和训练机理进行基分类器的优选,最后,引入信息熵的概念,基于各个基分类器分类结果的分散程度,计算其权重占比,并以该权重占比集成各基分类器的输出。实验结果表明,对比传统的窃电检测模型,本文所提模型在多项评价指标下表现较好,具有良好的检测性能。  相似文献   

14.
基于不确定数据的表示模型, 针对属性级不确定数据, 提出一种不确定数据生成算法AC UDGen(attribute level continuous uncertain data set generation algorithm). 该算法通过引入离群点检测 LOF(local outlier factor)算法, 用每个数据对象的离群因子作为参数来控制不确定数据对象的扰动范围, 可很好地满足原始数据的分布特征, 解决了目前工作中缺乏原始数据分布特征的问题. 实验结果表明, 该算法生成的不确定数据集具有更好的聚类效果, 并降低了离群点对聚类结果的影响, 使每个数据对象MBR(minimum bounding rectangle)的大小可根据自身的分布特征自适应地变化.  相似文献   

15.
在采用主成分分析(principal component analysis,PCA)算法进行故障检测时,主元的选取及处理直接影响其故障检测的表现。对此,提出一种基于全变量表达(full variable expression,FVE)和海林格距离(Hellinger distance,HD)的故障检测方法。首先,利用FVE得到所有关键主元,即保留所有变量信息;然后考虑到与故障相关主元的重要性,定义基于海林格距离的变化率,用来衡量正常工况下主元与异常工况下主元的差异;对与故障发生更相关的主元进行加权,以突出与故障相关主元对于后续故障检测的影响;最后,考虑到降维后数据通常服从非高斯分布,利用改进的局部离群因子(local outlier factor,LOF)构建统计量,其相应控制限通过核密度估计(kernel density estimation,KDE)确定。数值实例及带钢热连轧实际生产数据验证了所提方法的有效性与优越性。  相似文献   

16.
针对服务型企业在选择供应商的过程中采用模糊层次分析法(FAHP)存在主观性过强、计算量过大等问题,提出了模糊层次分析法与理想点法相结合的评价方法,即建立合理的服务型企业供应商评价指标体系,运用三角模糊层次分析法(TFAHP)对各评价指标体系进行权重求解,然后利用理想点法(TOPSIS)得到的标准化矩阵与三角模糊层次分析法得到的各指标权重相结合计算出加权标准化矩阵,最后通过对理想点的贴近程度对各供应商的综合能力进行排序。结果表明:该方法能够有效地减少供应商评价中主观因素的影响,降低其计算难度,通过实际案例分析,验证了FAHP-TOPSIS结合法能够为服务型企业提供较有针对性的供应商选择策略,具有较好的实际应用价值。  相似文献   

17.
由于异常值的存在对统计推断有很大影响,因此异常值检测是数据分析中的一个重要步骤。对于横截面数据的线性模型,改写模型的设计矩阵后,基于均值漂移模型,利用系数压缩估计方法来进行异常值检测。由于系数压缩估计中调节参数的选择对检测效果有很大影响,基于两种调节方法的加权,提出了一种新的调节方法。数值模拟结果表明,使用这种基于均值漂移模型的异常值检测调节方法,可以显著降低犯两种错误的概率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号