共查询到20条相似文献,搜索用时 77 毫秒
1.
孤立点检测是数据挖掘研究中的一项重要内容,其目标是发现数据集中行为异常的数据对象.本文在局部稀疏系数算法的基础上提出了基于局部最大距离的局部孤立点检测算法,该算法提出检测孤立点只需计算它的最近邻居对象的最大距离.实验结果表明,该算法发现局部孤立点是高效的。 相似文献
2.
针对现实世界中的不确定与不完整数据,根据粗糙集理论的框架提出了一种基于距离的异常检测方法.由于粗糙集理论是处理不确定性与不完整性的一种有效工具,因此该方法可以从不确定与不完整的数据中高效地检测出异常.另外,定义了2种特定的距离度量,用来计算2个对象之间的距离.最后,对粗糙集理论中基于距离的异常检测算法也进行了讨论. 相似文献
3.
基于角度分布的高维数据流异常点检测算法 总被引:1,自引:0,他引:1
为了有效检测高维数据流中的异常点,提出一种基于角度分布的高维数据流异常点检测(DSOD)算法.运用基于角度分布的方法准确识别高维数据集中的正常点、边界点以及异常点;构造了基于正常集、边界集的小规模数据流型计算集,以降低算法在空间以及时间上的开销;建立了正常集、边界集的更新机制,以解决大数据流的概念转移问题.在真实数据集上的实验结果表明,所提出的DSOD算法的效率高于Simple VOA算法与ABOD算法,并且适用于大数据流上的异常点检测. 相似文献
4.
提出了一种基于距离和密度的聚类和孤立点检测算法.该算法根据距离和密度阈值对数据进行聚类,同时发现数据中的孤立点.实验结果表明,该算法能够识别任意形状的聚类,对高维数据有效,能够很好的识别出孤立点. 相似文献
5.
6.
基于局部K-距离的靶场异常数据检测算法 总被引:1,自引:0,他引:1
航天靶场观测数据是鉴定运载火箭性能的重要依据,数据中的异常值严重影响数据处理的质量.传统的靶场异常数据处理方法不能适应日益提高的精度要求.为了解决这一问题,文章分析了测量数据中粗大误差的特点,提出了一种适合靶场观测数据的基于局部K-距离的异常数据检测算法LKD(Local K-Distance).该算法通过计算对象与最近k个最近邻中的最大距离来分析数据对象的稀疏程度,从而检测异常值.实验结果证明,该方法简单快速,对粗大误差的检测有效率可达90%以上. 相似文献
7.
韦佳;彭宏;林毅申 《华南理工大学学报(自然科学版)》2008,36(9)
局部切空间排列算法(LTSA)是一种有效的流形学习方法,但该算法对孤立点的存在非常敏感.本文提出了一种快速有效的数据预处理方法-基于改进距离的孤立点检测方法来降低孤立点对LTSA算法的影响.该方法通过改进距离来度量样本点之间的距离,降低了样本点分布不均给孤立点检测算法带来的影响.实验表明,该数据预处理方法能有效地提高LTSA算法的鲁棒性,可以更好的挖掘数据集的本征特性,具有更好的数据可视化效果. 相似文献
8.
在基于距离的孤立检测算法的基础上,讨论了基于距离和的孤立点检测算法,并将CURE聚类算法中使用的抽样算法应用于对该算法中的数据抽取,并创新地将该算法应用于纳税行为分析.结果表明,此算法可以有效地检测出纳税行为中的异常现象即孤立点,对纳税行为的分析有非常有效的作用. 相似文献
9.
10.
为了减少基于密度的异常点检测算法邻域查询操作的次数,同时避免ODBSN(Outlier Detection Based onSquare Neighborhood)中有意义异常点的丢失和稀疏聚类中的对象靠近稠密聚类时导致错误的异常点判断,提出了一种基于邻域和密度的异常点检测算法NDOD(Neighborhood and Density based Outlier Detection)。NDOD吸收基于网格方法的思想,以广度优先扩张方形邻域,成倍地减少了邻域查询的次数,从而快速排除聚类点并克服基于网格方法中的"维灾"。新引入的基于邻域的局部异常因子代表候选异常点的异常程度,用于对候选异常点的精选,可避免ODBSN的缺陷,发现更多有意义的异常点。大规模和任意形状的二维空间数据的测试结果表明,该算法是可行有效的。 相似文献
11.
卢鹏飞 《江南大学学报(自然科学版)》1990,5(2):20-26
本文研究了用 Qualitative Robust 估计建立随机过程 ARMA(p,q)模型时检测异常数据的新算法。构造了新的Ψ-函数,使之具有较宽的适用范围,既能使数据逐层压缩,又有利于检测异常数据;导出了迭代过程中异常数据估计量及其统计特性;锐化了异常数据对判决的影响;构造了最小距离判决规则;给出了迭代算法。Monte Carlo 模拟显示了良好的效果。 相似文献
12.
由于支持向量机具有较好地学习性能和泛化能力,目前已经得到了广泛的应用。如何使支持向量机进行有效的增量学习是目前支持向量机应用中需要解决的问题。深入研究了支持向量分布特点,提出了一种新的支持向量机增量训练淘汰机制——距离比值算法。该算法根据遗忘规则,设定一个合适的参数,按距离比值法中的定义计算各个样本中心距离与其到最优分类面距离的比值,舍弃对后续训练影响不大的样本,即可对训练数据进行有效的淘汰。对标准数据集的实验结果表明,使用该方法进行增量训练在保证分类精度的同时,能有效地提高训练速度。 相似文献
13.
利用员工间的心理契约,建立横向监督激励模型出发,通过模型分析了企业创造构建员工间心理契约关系的环境和氛围,发挥员工间横向监督激励作用。通过横向监督激励模型分析得出:企业一旦创造出良好的成员间心理契约关系环境和氛围,虽然企业的最优激励强度不变但是员工的努力水平却提高了,也就是说施加到偷懒员工的同事压力使得企业在不增加激励成本的情况下获得来自员工较高的努力投入,从而营造员工团结合作,相互激励这种高努力的工作氛围。 相似文献
14.
基于遗传算法的Kriging空间分析及其应用 总被引:1,自引:0,他引:1
半变异函数是Kriging空间分析法中的重要数学模型,在得到实际变异函数图的基础上用遗传算法来估计半变异函数中的参数比用传统的线形回归方法更精确更自动化。介绍了用遗传算法拟合Kriging空间分析法中变异函数的模型的方法,并以分析某区域煤层厚度分布情况为例介绍了该方法的应用。 相似文献
15.
将经典的PageRank算法和汉明距离相似度算法结合,提出一种新的网页排序方法。通过结合汉明距离(Hamming distance)相似度算法,计算检索词和网页文本相似度,提高搜索查准率;在增加检索词的同义词的搜索过程中,通过改进汉明距离相似度算法,提高搜索查全率。实验结果表明,该方法与PageRank算法相比,拥有了更好的效果。 相似文献
16.
为了进一步减小系统误差,更加有效防止目标类权值分布扭曲现象的发生,针对传统AdaBoost人脸检测算法存在的不足,对算法的权值更新规则和权值归一化规则进行了综合改进,实验结果证明了改进算法的有效性. 相似文献
17.
针对一致聚类算法中聚类数目判断不准确、聚类速度慢等问题,通过集成复杂网络中的Newman贪婪算法与谱聚类算法,提出了一种新的基于Minkowski距离的一致聚类算法.该算法利用Minkowski距离刻画样本间的相似度,根据随机游走策略,结合不同数据的特征值分布分析方法进行聚类,实现聚类数目的自动识别.实验仿真说明算法具有较少的运算时间及较高的聚类精度.结合实际铜矿泡沫浮选过程特点,将该算法应用于浮选工况分类,进一步验证了算法的有效性. 相似文献
18.
天空背景的复杂性与飞机目标的多样性,对基于传统目标检测算法的飞机目标检测带来了巨大的挑战。本文基于图像的稀疏表示理论,提出了基于多尺度超完备字典的飞机目标检测算法。算法综合了不同尺度下超完备字典各自的优点:利用低分辨率图像块学习小尺度字典,构造小尺度分类器,在低分辨率测试图像中完成前景粗检测;利用高分辨率图像块学习大尺度字典,构造大尺度分类器,在高分辨率测试图像中完成前景精检测;最后通过飞机图像块学习飞机目标字典,构造飞机目标分类器,完成前景目标分类。实验结果表明,算法能有效完成天空背景下的飞机目标检测任务,时间开销与小尺度字典目标检测相当,但在精度上逼近大尺度字典目标检测。 相似文献
19.
为实现高效、 低功耗的区域定位, 综合主流的WSN(Wireless Sensor Network)定位技术, 提出RSSI(Received Signal Strength Indication)修正的质心定位实用算法, 并搭建了无线传感网络, 制定了高效的通信定位协议。根据通信协议, 上位机发送指令试探性寻址盲节点, 盲节点应答并通过其相邻的参考节点的感知进行反馈, 最终上位机基于RSSI的运算进行盲节点的坐标定位。实验结果表明, RSSI修正的质心定位算法可高效地对节点进行定位, 降低盲节点功耗, 具备现实应用的价值。 相似文献
20.
为实现高效、低功耗的区域定位,综合主流的WSN(Wireless Sensor Network)定位技术,提出RSSI(Received Signal Strength Indication)修正的质心定位实用算法,并搭建了无线传感网络,制定了高效的通信定位协议.根据通信协议,上位机发送指令试探性寻址盲节点,盲节点应答并通过其相邻的参考节点的感知进行反馈,最终上位机基于RSSI的运算进行盲节点的坐标定位.实验结果表明,RSSI修正的质心定位算法可高效地对节点进行定位,降低盲节点功耗,具备现实应用的价值. 相似文献