首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于加权距离的局部离群点检测算法
引用本文:尹成祥,张宏军,张睿,綦秀利,王彬.基于加权距离的局部离群点检测算法[J].科学技术与工程,2014,14(15):85-88,92.
作者姓名:尹成祥  张宏军  张睿  綦秀利  王彬
作者单位:解放军理工大学,解放军理工大学,解放军理工大学,解放军理工大学,解放军理工大学
基金项目:国家自然科学基金资助项目(70971137) 基于训练效果的部队作战效能评估及作战计划制定方法研究
摘    要:针对不同属性对数据点之间距离贡献的不同,提出了一种用于距离度量的属性加权策略。标称属性通过属性取值的信息熵进行加权,数值属性通过属性取值的标准差进行加权,混合属性根据标称属性和数值属性综合加权,加权策略可以放大离群点与正常数据之间的差别。仿真实验区分不同的属性类型对所提加权策略进行了验证,实验结果证明了策略的有效性。

关 键 词:属性加权  信息熵  标准差  局部离群点因子(local  cutlier  factor  LOF)算法
收稿时间:1/3/2014 12:00:00 AM
修稿时间:2014/2/18 0:00:00

A Weighted-distance based outliers detection Algorithm
YIN Cheng-xiang,ZHANG Hong-jun,ZHANG Rui,QI Xiu-li and WANG Bin.A Weighted-distance based outliers detection Algorithm[J].Science Technology and Engineering,2014,14(15):85-88,92.
Authors:YIN Cheng-xiang  ZHANG Hong-jun  ZHANG Rui  QI Xiu-li and WANG Bin
Institution:PLA Univ. of Sci. Tech.,PLA Univ. of Sci. Tech.,PLA Univ. of Sci. Tech.,PLA Univ. of Sci. Tech.
Abstract:With respect to the fact that different attribute has different affluence on the distance between data points, a strategy to weight attributes when calculating distance was proposed. According to the strategy, categorical attributes were weighted based on the entropies while numerical ones based on standard deviations. When dealing with mixed attributes, a method was introduced to integrate the weights gained from categorical attributes and numerical ones. The proposed strategy makes the outliers more significant. Experiments on different kinds of data prove the effectiveness of the proposed strategy.
Keywords:weighting attributes  Information Entropy  Standard deviation  LOF Algorithm
本文献已被 CNKI 等数据库收录!
点击此处可从《科学技术与工程》浏览原始摘要信息
点击此处可从《科学技术与工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号