首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
K-近邻算法(K-nearest neighbor,KNN)是一种思路简单、易于掌握、分类效果显著的算法。决定K-近邻算法分类效果关键因素之一就是距离的度量,欧氏距离经常作为K-近邻算法中度量函数,欧式距离将样本的不同特征量赋予相同的权重,但是不同特征量对分类结果准确性影响是不同的。采用更能体现特征量之间相对关系的卡方距离度量作为KNN算法的度量函数,并且采用灵敏度法进行特征权重计算,克服欧氏距离的不足。分类实验结果显示,基于卡方距离的改进算法的各项评价指标优于传统的KNN算法。  相似文献   

2.
为提高列车车轮踏面检测效率,设计了一套基于机器视觉的车轮踏面动态检测系统,分析了k-means聚类算法,通过加权欧式距离对该算法进行改进,利用聚类法具有保持最大相似性的特性,将基于加权欧式距离的k-means聚类算法用于机器视觉的图像处理。先对原始图像作图像增强、图像灰度化等预处理,再以特征聚类思想对图像作阈值分割,使图像中的各部分特征更加突出。图像处理结果显示,基于加权欧式距离k-means聚类算法的车轮踏面损伤视觉检测系统可以有效地检测出踏面损伤。  相似文献   

3.
传统K-means聚类算法通过欧式距离计算样本的相似度,将数据所有的属性特征均平等对待,忽略每个属性特征的不同贡献,导致样本相似度计算的准确率不高。针对这个不足,提出一种特征加权的K-means算法进行优化。首先,运用Softmax和Sigmoid逻辑回归函数计算特征权重,使得加权的欧式距离更能准确地表示样本相似度;其次,优化初始聚类中心选择策略,选择距离较大的K个样本作为初始聚类中心,可有效避免样本的错误聚类及空簇问题。实验结果表明,在UCI标准数据集中采用加权K-means聚类算法可以有效减少迭代次数,提高聚类的准确率、精确率和召回率。  相似文献   

4.
传统的KNN算法在大样本的情况下对试验样本有较强的一致性结果.但该算法每一次都是在样本全局的基础上进行归类计算,这在很大程度上消耗了空间,增大了算法空间复杂度;且算法在样本分类不平衡时,预测偏差相对偏高.针对这些问题,提出了基于交叉验证和距离加权的改进KNN算法(Weighted cross-validation KNN,简称WCKNN),经过实验验证,本算法有效减小了算法的空间复杂度;同时,也获得了更好的分类性能.  相似文献   

5.
针对单一k近邻算法(KNN)和最小二乘支持向量机(LSSVM)存在的缺陷, 提出一种基于KNN LSSVM的Android恶意行为识别模型. 先采集Android用户行为样本, 并提取相应特征组成特征向量; 再将训练集输入LSSVM中进行学习, 计算测试样本与最优分类平面间的距离, 如果该距离小于阈值, 则直接采用LSSVM恶意行为识别, 否则采用KNN算法进行恶意行为识别; 最后采用仿真实验测试KNN LSSVM的性能. 实验结果表明, 相对于单一KNN算法和LSSVM, KNN LSSVM提高了Android恶意行为的识别正确率,可以满足Android[KG*6]恶意行为的在线识别要求.  相似文献   

6.
针对多模态过程数据密度不规则性提出的一类基于密度的方法,大多是以欧式距离为基础来比较彼此间的相似性,从而检测过程是否发生故障。然而多模态数据密度在较小范围内变化较大,采用欧式距离很难获得全面的数据信息。本文提出了一种新的基于加权距离选择邻居的策略,该策略首先对距离进行合理的加权,再根据新的加权距离重新选择样本点的邻居,能有效地避免数据信息不全面的问题。在仿真实验中,首先通过比较基于传统的欧式距离和基于本文加权距离选取的邻居,说明本文策略的优越性;进而将该策略与局部离群因子(Local Outlier Factor,LOF)结合用于TE过程,对TE过程的仿真结果表明该策略在应用于基于密度的检测方法上获得了的良好效果。  相似文献   

7.
提出了一种新的异常行为检测方法,将SVM算法和KNN算法结合,在对识别样本判别时,当其与最优分类面的距离大于给定阈值时,采用SVM分类算法,否则采用KNN算法,从而减少了SVM算法的错误率.实验结果表明,SVM-KNN算法对异常行为检测的准确率达到95.86%.  相似文献   

8.
大数据时代带来数据处理模式的变革,依托Hadoop分布式编程框架处理大数据问题是当前该领域的研究热点之一。为解决海量数据挖掘中的分类问题,提出基于一种双度量中心索引KNN分类算法。该算法在针对存在类别域的交叉或重叠较多的大数据,先对训练集进行中心点的确定,通过计算分类集与训练集中心点的欧式距离,确定最相似的3个类别,然后以余弦距离为度量,通过索引选择找出K个近邻点,经过MapReduce编程框架对KNN并行计算加以实现。最后在UCI数据库进行比较验证,结果表明提出的并行化改进算法在准确率略有提高的基础上,运算效率得到了极大提高。  相似文献   

9.
提出了一种新的异常行为检测方法,将SVM算法和KNN算法结合,在对识别样本判别时,当其与最优分类面的距离大于给定阈值时,采用SVM分类算法,否则采用KNN算法,从而减少了SVM算法的错误率。实验结果表明,SVM-KNN算法对异常行为检测的准确率达到95.86%。  相似文献   

10.
分析了KNN分类算法的流程,然后在K值的动态获取和分类加权两个方面对分类算法进行改进;利用MapReduce编程思想完成KNN分类算法在Hadoop集群环境下的移植和实现。实验数据证明,改进后的KNN分类算法在人脸识别精度、识别效率和稳定性3个方面得到了有效提高。  相似文献   

11.
分析了CHAMELEON聚类算法的不足,定义一种基于k最临近集和共享k最临近集的相似度函数,在此基础上提出了一种结合分类算法的新聚类算法,经过对模拟的复杂数据组和KDD Cup'99网络非法入侵数据的实验,证明该算法能有效的对由大量噪音和不同形状、大小及密度的类组成的高维数据进行聚类.  相似文献   

12.
为了提高多输入多输出正交频分复用(MIMO-OFDM)系统的信道估计性能,提出了一种基于K近邻加权孪生支持向量回归(KNN-TSVR)的信道频率响应估计算法.该算法的工作过程是首先用最小二乘算法对导频位置的信道参数进行估计,获取训练样本,然后用K近邻(KNN)算法对训练样本进行预处理,得到赋予各样本的权重,最后由加权TSVR对MIMO-OFDM系统所有位置的信道参数进行插值估计.本文提出的改进的加权TSVR信道估计方法不仅具有TSVR对非线性关系回归的优势,同时引入KNN算法对TSVR进行改进,使得该算法与传统TSVR相比,具有更好的回归性能和抗噪声能力.对非线性MIMO-OFDM信道进行估计的仿真实验结果证实了这一结论.  相似文献   

13.
变异特征加权的异常语音说话人识别算法   总被引:1,自引:1,他引:0  
常用的加权算法难以跟踪非常态语音特征的变异,为此,文中提出了一种变异特征加权的异常语音说话人识别算法.首先统计大量正常语音各阶MFCC特征的概率分布,建立正常语音特征模板;然后用测试语音特征与正常语音特征模板之间的K-L距离和欧氏距离来度量语音的变异程度,确定K-L加权因子和欧氏加权因子;最后利用加权因子对测试语音的MFCC特征进行加权,并将加权后的特征输入高斯混合模型进行异常语音说话人识别.实验结果表明,文中提出的K-L加权和欧氏加权的异常语音说话人识别算法的整体识别率分别为46.61%和42.25%,而基于各阶特征对说话人识别贡献的加权算法和不加权算法的整体识别率分别为39.68%和36.36%.  相似文献   

14.
距离修正的混沌粒子群多维标度定位算法   总被引:2,自引:0,他引:2  
针对不规则网络以及网络空洞造成估计距离与欧氏距离相差较大,导致定位精度不足这一问题,提出一种距离修正的混沌粒子群多维标度定位算法(CMDS-CPSO).首先通过递推策略计算节点对距离,利用接收信号强度对距离加权修正,以减少距离误差,回避网络空洞问题.然后采用混沌粒子群算法对坐标转化参数问题进行优化,进一步降低坐标转换中参数所带来的影响.通过对比SPSO-MDS算法与MDS-DMC算法,仿真结果表明,距离修正的混沌粒子群算法能够明显改善节点定位精度,具有更好的鲁棒性和对不规则网络的适应性.  相似文献   

15.
公路网中移动兴趣点(POIs)的查询处理是一个难点,目前的研究多基于欧氏距离对静态POIs进行处理,不能很好地适应移动环境下终端弱连接和频繁移动的需要.文中在公路网移动计算场景下,设计了一种存储分区数据对象的结构来表示公路网图形模型,提出适用于移动终端的连续KNN查询(CQ-KNN)算法.该算法改进了Wang等提出的MKNN算法,将逐层渐近探测和检索边列表结合起来进行近邻查询,避免了MKNN算法在限定层数不够却不得不执行范围查询时所带来的开销;同时使用缓存策略来支持移动终端提交的连续查询请求,并给出基于广播位置失效报告的缓存一致性维护策略.仿真结果表明,CQ-KNN算法较MKNN算法有更快的CPU处理速度和更短的网络响应延时,并且能支持移动终端的离线KNN近似查询.  相似文献   

16.
基于改进K-均值聚类的图像分割算法研究   总被引:3,自引:0,他引:3  
为了实现彩色图像的准确分割,研究了在HLS颜色空间中基于优化初始中心的加权K-均值彩色图像聚类算法.首先对大样本的目标颜色进行数理统计,获取优化的初始聚类中心,从而实现准确分类和避免K-均值容易陷入局部最优的问题;然后在HLS颜色空间中引入加权欧氏距离来度量对象间的相关性,通过调整系数使对象不同的颜色属性内在特征得以充分利用.实验证明,该算法在保持K-均值聚类简洁、收敛速度快的同时能产生更好的聚类效果,实现彩色图像的快速准确分割.  相似文献   

17.
针对无线传感器网络特点,在算法初始阶段,增加计算信标点到待定位点Euclidean(欧几里德)距离,用最大似然粗略估计节点位置,根据此初始位置用最小二乘的加权融合思想循环求精.提出多跳Euclidean距离计算方法,对其多解提出解决方案.在对加权矩阵的求解提出新看法的基础上,搜索满足定位条件的待定位节点,定位后的节点升级为辅助信标点.仿真结果表明,在网络连通度为8的条件下,这是一种精度高、覆盖率高的实用性算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号