首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 390 毫秒
1.
针对单一k近邻算法(KNN)和最小二乘支持向量机(LSSVM)存在的缺陷, 提出一种基于KNN LSSVM的Android恶意行为识别模型. 先采集Android用户行为样本, 并提取相应特征组成特征向量; 再将训练集输入LSSVM中进行学习, 计算测试样本与最优分类平面间的距离, 如果该距离小于阈值, 则直接采用LSSVM恶意行为识别, 否则采用KNN算法进行恶意行为识别; 最后采用仿真实验测试KNN LSSVM的性能. 实验结果表明, 相对于单一KNN算法和LSSVM, KNN LSSVM提高了Android恶意行为的识别正确率,可以满足Android[KG*6]恶意行为的在线识别要求.  相似文献   

2.
经典KNN算法在处理高维数据或样本数繁多的样本集时需要巨大的计算量,这使其在实际应用的过程中存在着一定的局限性;提出一种基于聚类和密度裁剪的改进KNN算法。在训练阶段,首先根据样本密度对整个训练集进行裁剪,然后将裁剪好的训练集进行聚类处理,得到若干个密度比较均匀的类簇并将其转化为超球。在测试阶段,采用两种方法,第一种是找出距离待测样本最近的k个超球,然后将这个k个超球内的训练样本作为新的训练样本集,在这个新的训练样本集上使用经典KNN算法得到待测样本的类别;第二种则是找出距离待测样本最近的1个超球,然后根据该超球的类别得出待测样本的类别。实验采用8个UCI样本集进行测试,实验结果表明,该算法同经典KNN相比具有良好的性能,是一种有效的分类方法。  相似文献   

3.
用于文本分类的快速KNN算法   总被引:1,自引:0,他引:1  
KNN(k Nearest Neighbor)算法是一种简单、有效、非参数的文本分类方法.传统的KNN方法有着样本相似度计算量大的明显缺陷,使其在具有大量高维样本的文本分类中缺乏实用性.提出了一种快速查找精确的k个最近邻的TKNN(Tree-k-Nearest-Neighbor)算法,该算法建立一棵用于查找的树,加速k个最近邻的查找.首先以整个样本集合中心为基准,按照距离中心的距离将所有样本进行排序,并等分L组,作为根结点的孩子,每个孩子以同样方式处理,直到每组样本数量在[k,2k]间为止.根据这棵树查找k个最近邻,减小了查找范围,极大地降低了相似度计算量.  相似文献   

4.
在毫米波雷达一维距离像识别中,为达到消除噪声与孤立点影响的目的,在研究了基于距离和样本紧密度的隶属度函数的基础上,提出了一种能反映雷达回波信号在特征空间分布的隶属度函数.用一个紧凑的超椭球体将样本包围起来,并使用超椭球体的方向半径度量样本之间的紧密度.将改进的基于样本紧密度的隶属度函数应用于模糊支持向量机中,可较好地区分开支持向量与含噪声或野值的样本.实验结果显示:随着雷达回波信号信噪比的降低,支持向量机的目标识别率迅速下降,而模糊支持向量机的目标识别率只下降了1%,有效地减小了噪声对一维距离像识别结果的影响.  相似文献   

5.
针对KNN算法样本相似度计算量大,计算冗余度高而效率低下的问题,提出了基于超球区域划分的改进KNN算法。该算法是在经典KNN算法上的改进。通过构造等半径超球集合,将所有训练样本分配到相应的超球中,因此一个待测样本的类别可以通过其最近邻的k个超球内的训练样本集来确定。为保证运算效率,设计算法去寻找最优的超球半径r。实验结果表明,基于超球区域划分的改进KNN算法与经典的传统KNN算法在效率和性能方面有较大的提高。  相似文献   

6.
针对毫米波高分辨率雷达一维距离像目标识别的多类分类问题.基于局部线性嵌入(Locally Linear Embedding,LLE)算法思想,考虑样本与其所在低维流形之间的关系,提出一种多类分类算法.该算法先确定样本所在低维流形的结构,然后通过比较未知样本与各类已知样本流形间的关系来分类.将其应用于毫米波高分辨率雷达一维距离像目标识别,实验结果表明,该算法能够有效地进行分类。性能优于其他常用多类分类算法.且对输入参数不敏感.  相似文献   

7.
利用小波变换对训练图像和待识别图像进行小波分解,提取低频分量,通过行扫描转化为列向量,作为特征向量;在此基础上,提出利用多元线性回归分析方法,利用最小二乘法获得训练特征与待识别特征之间的线性模型,经由残差分析确定待识别样本的类别.利用ORL人脸库,与支持向量机(SVM)分类器和K-最近邻分类器(KNN)进行了对比实验,实验结果表明本文算法识别精度跟SVM相当,优于KNN.  相似文献   

8.
针对传统局部线性嵌入算法在挖掘局部流形结构时未充分考虑样本邻居分布信息,且在降维过程中默认样本具有相同的重要性导致提取鉴别特征不明显的问题,提出基于共享近邻的加权局部线性嵌入(weighted local linear embedding based on shared neighbors, SN-WLLE)算法,并用于滚动轴承故障诊断.该算法首先使用余弦距离划分样本邻域;其次计算样本邻域对相似度用以评估样本共享近邻信息,并结合样本的6种邻居分布修正局部结构挖掘,提高多共享近邻的k近邻重构准确性;接着从多流形的角度评估样本点与近邻点间的稀疏分布一致性,以获得样本的重要性指标,并在低维空间保持该信息,进而提取准确的鉴别特征;最后结合KNN分类器构建出完备的轴承故障诊断模型.采用凯斯西储大学轴承数据集和实验室测试平台轴承数据集,从可视化评估、定量聚类评估、故障识别精度评估及鲁棒性评估等方面进行分析.结果表明:SN-WLLE算法的F值保持在108以上水准,平均故障识别精度最低可达0.973 4,不仅具有较好的类内紧致性与类间可分性,还对近邻参数k具有低敏感性.  相似文献   

9.
针对传统KNN算法忽略样本分布对分类的影响,易受到孤立样本、噪音等干扰,时间代价大等问题,提出了一种改进的近邻分类算法.该算法首先采用类维样本存储,打破了样本的整体性,转换了训练样本存储模式;其次按类维度寻求未知样本的类维近邻域,计算类维相似度进而得到未知样本的类别相似度;最后以最大类别相似度标识未知样本.该算法提高了分类效率,降低了独立样本对样本分类的影响.同时可处理连续型和标识型样本分类,并可适应各类样本分布情况,扩大了算法的应用范围.实验结果表明,该算法较传统的近邻算法与邻域分类算法在分类精度与分类时间上有了较大提升.  相似文献   

10.
针对文本分类存在的高维文本问题,提出文档频率(DF)-卡方统计量特征提取方式,对特征项进行有效约减,降低文本维度,提高分类精度.在K最近邻(KNN)算法的基础上,针对待分类文本需要和大量训练集样本进行相似度计算的问题,提出一种基于分组中心向量的KNN算法,对类别内的样本集分组求出各组中心向量,使其重新代表训练库计算相似度,降低计算复杂度,提升算法的分类性能.通过实验表明:相较传统KNN算法,改进的算法在准确率、召回率及F值方面都有提升,与其他分类算法相比,具有一定的优势.  相似文献   

11.
针对K近邻方法分类准确率较高的特性,提出了一种基于相似度判据的K近邻分类器车牌字符识别方法.通过大量实验,选取字符的网格特征和轮廓特征作为分类依据,用特征融合方法将两种特征合并,实现特征的串行融合.根据相似度判据作K近邻分类,实现了一个车牌字符识别系统.实验表明,这种方法具有良好的识别效果,鲁棒性强,具有较大的实用价值.  相似文献   

12.
基于Fisherface和组合KNN分类器的人脸识别算法   总被引:1,自引:0,他引:1  
基于Fisherfaee和组合K近邻(KNN)分类方法的人脸识别算法首先采用Fisherfaee进行特征提取,构成特征空间。然后,利用组合KNN分类器对提取的特征进行识别。在ORL人脸数据库上的实验结果表明该方法具有良好的性能。  相似文献   

13.
山区小流域洪水预报实时校正研究   总被引:4,自引:4,他引:0  
为了解决现有实时校正方法对山区小流域洪水进行校正能力不足的问题,引入K最近邻算法用于洪水预报实时校正。以安徽省沙埠流域为试验流域,构建基于K最近邻算法的实时校正模型,同时采用BP神经网络实时校正法和传统的误差自回归方法,以洪峰相对误差和确定性系数为评价指标,分析各校正模型的校正结果。结果表明:基于K最近邻的实时校正法对确定性系数改善最优,BP神经网络实时校正法对洪峰误差校正更精确;将历史洪水资料纳入学习样本后,基于K最近邻的实时校正法的校正能力将进一步提升。基于K最近邻的实时校正法能够有效避免误差自回归方法对洪峰误差控制较差的缺陷,适应性强,反应灵敏,精确度高,可作为山区小流域洪水预报实时校正的有效工具。  相似文献   

14.
为解决在野外环境中使用传统模式识别方法对低信噪比(signal-noise rate, SNR)的人车地震动信号进行分类时应用不便,效果不佳的问题,提出了通过基于包络检波、变分模态分解(variational mode decomposition, VMD)和改进的深度自编码器(deep auto-encoder, DAE)的特征提取算法。首先对目标的地震动信号进行希尔伯特变换以获取信号的平滑包络线,然后进行变分模态分解得到本征模函数(intrinsic mode function, IMF)信号,并利用皮尔森相关系数对分解得到的IMF信号进行筛选,之后将相关度较高的分量加权为高信噪比的中间信号,再使用改进的深度自编码器对其进行特征提取,最后使用泛化性能好的随机森林算法充当分类器,从而实现对人车目标的识别和分类。结果表明:所提算法有效缓解了其他传统算法的部分缺陷,综合识别正确率有所提高,且更加方便应用。  相似文献   

15.
陈雪芳 《科学技术与工程》2013,13(20):5839-5842,5847
针对传统支持向量机算法时空复杂度较高的不足,提出了一种基于交叉验证KNN的支持向量预选取算法。该算法首先对原始样本求k个的邻近样本,然后计算邻近样本中异类样本的比例p1,最后选取满足p1大于阈值p的原始样本作为支持向量。通过交叉验证方法确定k与p的最合适的数值。在UCI标准数据集和说话人识别数据集上的仿真实验显示算法可有效地降低支持向量机分类器的运行时间,同时又具有较好的分类性能。  相似文献   

16.
以相关系数为特征量的飞机目标识别法   总被引:3,自引:0,他引:3  
利用各目标距离像之间的相关系数 ,可提高基于距离像建库的目标识别方法的性能。该文提出了利用相关系数构造特征矢量和用神经网络进行分类的雷达目标识别方法。研究了特征矢量的分类性能、最终判决量的确定、相关系数特征矢量法与最大相关系数法各自的特点等问题。对 6类飞机目标全方位角范围的识别结果表明 :最大相关系数法在高信噪比时的识别率较高 ,相关系数特征矢量法的抗噪性较强 ,两种识别方法有较强的互补性。若按某种方式将两者结合起来 ,将得到识别率和抗噪性俱佳的识别方法  相似文献   

17.
应用特征聚合进行中文文本分类的改进KNN算法   总被引:14,自引:0,他引:14  
针对以KNN为代表的VSM模型存在的向量各特征项孤立处理问题 ,提出了一种应用特征聚合方式的改进算法·该算法通过CHI概率统计计算文本特征词对分类的贡献 ,将对分类有相同贡献的文本特征词聚合 ,使用它们共同的分类贡献模式代替传统算法中单个词对应向量一维的方式·该算法提高了稀有词对分类的贡献、强化了关联词的分类效果、并降低了文本向量的维数·与传统KNN算法进行的对比实验证明 ,该算法明显提高了分类的准确率和召回率  相似文献   

18.
针对传统局部二值模式(local binary pattern,LBP)算子提取的图像纹理特征不完整、不能全面刻画人脸局部特征的问题,提出一种基于邻域相关度的改进LBP算子.该算子首先计算窗口内每个像素点的邻域相关度;其次利用邻域相关度的均值和方差构造新的NC_LBP算子,进而提取图像局部直方图特征,作为人脸识别的依据;最后利用Chi平方统计法计算直方图的不相似度,并用KNN算法进行分类.仿真实验表明,改进NC_LBP算子在ORL,JAFFE和YALE人脸数据库的识别中效果较好,特征区分度明显,识别准确率较高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号