首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
传统的KNN算法的时间复杂度与样本规模成正比,大规模或高维数据会降低其分类效率。为此,提出一种改进的KNN快速分类算法。该算法以固定半径长度构造超球为原则,为训练样本集构造多个包围超球。根据各个超球内包含的训练样本集的重心位置与测试样本的位置关系可以快速搜索测试样本的k个最近邻超球,然后以k个最近邻超球内的训练样本集构造新的训练样本集。在新的训练样本集中求测试样本的k个最近邻,从而获得该测试样本的类别。实验表明,改进的KNN快速分类算法的分类准确率得到一定程度的提高、运行效率明显提升。  相似文献   

2.
针对大规模人脸识别问题,提出了一种基于两级非负线性编码表示的人脸识别方法.首先利用第一级的线性编码表示,通过在初始的大规模人脸库中寻找对应测试图像的M最近邻,以消除干扰训练样本并降低训练样本集的规模;然后以此M最近邻为训练样本集,通过第二级的线性编码表示实现对测试样本的分类判别.在线性编码表示中,通过进一步引入非负系数约束,更好地改善了分类识别性能.基于AR、ORL和Yale B人脸库的实验结果初步验证了文中所提方法的有效性.  相似文献   

3.
一种新的支持向量分类算法ACNN-SVM   总被引:1,自引:0,他引:1  
针对NN-SVM算法的不足,提出了一种新的支持向量分类算法--ACNN-SVM.先对训练样本集进行最近邻修剪,用SVM训练得到一个SVM模型,然后,计算最近邻修剪后的训练样本集中样本到超平面的距离,如果距离差大于给定的阈值则将其从最近邻修剪后的训练样本集中删除,最后对冉修剪后的样本集用SVM训练得到一个最终的SVM模型.实验表明,ACNN-SVM算法的效果优于NN-SVM算法.  相似文献   

4.
基于稀疏表示分类(SRC,sparse representation for classification)是近年来模式识别领域中备受关注的一个研究热点。当每类训练样本较少时,SRC的识别效果往往不理想。为解决此问题,人们提出了拓展的稀疏表示分类算法。它引入了训练样本的类内变量矩阵,来补充每类训练样本信息。但是,该方法很难获取普遍存在于复杂数据如图像中的非线性信息。为此,提出了特征空间中的拓展稀疏人脸识别算法。该算法将样本集非线性映射到新的特征空间中,计算每个训练样本在表示测试样本时所做的贡献。根据贡献大小,给每个训练样本赋予一定的权重。同时,利用类内变量矩阵,共同表示测试样本。实验表明所提出的算法优于其它经典稀疏表示分类算法。  相似文献   

5.
针对kNN分类算法对不平衡数据进行分类可能偏向多数类的问题,提出了象限壳近邻分类算法。该算法仅选择测试样本象限方向上的最近邻的训练样本来判断其所属类别,从而有效地避免了kNN算法对选取k个最近邻训练样本时可能产生偏向多数类的问题。通过在UCI真实不平衡数据集上的实验,该文提出的分类算法在Recall、F-value和G-mean等评价标准明显优于传统的kNN分类算法。  相似文献   

6.
提出基于稀疏表示和最小二乘回归的分类方法:用训练样本重构测试样本,先利用稀疏表示剔除噪声样本,接着用最小二乘回归和最近邻子空间准则对样本分类,可以克服传统分类方法存在的过拟合问题.在6个基因表达数据上的实验结果表明,该方法可以提高分类准确率.  相似文献   

7.
在模式分类中.基于旋转不变范数的回归分类器(RRC)最近得到广泛的应用.然而RRC的稀疏重构是建立在全体训练样本之上.当训练样本的数量很大时,计算的时耗比较大.同时,对稀疏程度的过度追求也在一定程度上影响了分类性能.基于K最近邻分类器提出了一类局部的基于K最近邻的L2,1范数稀疏回归分类器(KNN—SRC),该分类器比全局的RRC计算速度快,同时。利用K最近邻点代替全体训练样本,在一定程上避免了非同类的相似样本对测试样本的过度稀疏表示,从而提高分类性能.KNN—SRC的分类性能在UCI的Wine数据集和Yale人脸数据库上作了检测.测试结果表明KNN—SRC分类性能优于RRC.  相似文献   

8.
提出了超长方体与KNN相结合的分类算法.在训练阶段,该算法为训练集中的每一个类别构造多个超长方体,区域分离每一类训练样本.在测试阶段,该算法首先检查测试样本是否被某一个超长方体包围,如是则其类别被识别出,否则用KNN方法确定其类别.实验采用四个真实数据集进行测试.实验结果表明基于超长方体与KNN的分类算法在四个数据集全部优于两个基于多球覆盖的分类方法,是一种有效的分类方法.  相似文献   

9.
K最近邻算法(KNN)在分类时,需要计算待分类样本与训练样本集中每个样本之间的相似度.当训练样本过多时,计算代价大,分类效率降低.因此,提出一种基于DBSCAN聚类的改进算法.利用DBSCAN聚类消除训练样本的噪声数据.同时,对于核心样本集中的样本,根据其样本相似度阈值和密度进行样本裁剪,以缩减与待分类样本计算相似度的训练样本个数.实验表明此算法能够在保持基本分类能力不变的情况下,有效地降低分类计算量.  相似文献   

10.
稀疏表示分类算法在有监督的图像识别上有广泛的应用.该分类算法的准确度与训练样本个数有很大的关联.通常训练样本越充分,则该算法分类准确率越高,然而遇到小样本问题时,该算法分类准确率会明显降低.针对小样本问题,提出使用基于图像边缘位移的方法,得到和原始训练图像样本高度相关的新样本,达到扩充训练样本容量的目的,进而提高算法的分类准确率.同时,对于带仿射约束的稀疏表示分类算法,也可以经过图像边缘位移方法来提高分类准确率.实验结果证明,所用方法能够取得较好的图像识别效果.  相似文献   

11.
针对SVM中当训练样本数非常多时,分类算法训练阶段的计算量庞大;当训练样本集中存在噪声时,影响训练阶段超平面划分的准确度,导致分类准确率降低等问题,提出了一种基于密度的训练样本裁剪的SVM算法。首先应用密度裁剪算法裁剪掉原始训练样本集中存在的噪声和冗余样本,作为新训练样本集,使用网格搜索算法在新的训练样本集中对SVM参数(C,g)寻优,进行SVM训练并建模,达到分类的目的。实验结果表明,该算法同无样本裁剪的SVM算法相比分类准确率有所提高、训练阶段的时间耗费大大降低。  相似文献   

12.
针对传统的基于低秩表示的方法需要重新在字典矩阵上计算测试样本的表示系数,会导致计算复杂度升高,降低训练和测试样本表示系数之间的相关性等问题,提出了一种结构化局部约束低秩表示算法用于人脸识别的方法.在原始低秩表示中引入理想编码系数矩阵正则项,使训练样本的表示系数矩阵具有块对角结构;为保持数据的流形结构,引入局部约束项,使相似样本具有相似的表示系数;使用简单的线性分类器对测试样本进行分类.在AR,Extended Yale B,ORL和LFW这4个标准数据集上进行了试验结果验证.结果表明:该算法可以同时得到训练和测试样本的表示系数,对人脸图像中的遮挡、像素破坏和光照变化等具有鲁棒性.  相似文献   

13.
稀疏表示近些年来被广泛用于人脸识别。由于在现实中,同类图像之间往往不可避免存在光照、姿态、甚至遮挡等差异,如果使用这些有各种差异的图像样本去表示某一特定状态下的图像,则表示的效果势必会受到影响。为进一步提高稀疏表示在人脸识别中的性能,基于原始协同分类(CRC)算法,引入近邻思想,即在各类训练样本中分别寻找与测试样本相近的若干样本,以构建新的近邻样本集;在此基础上进行协同表示,并利用每类样本系数分别重构待测样本,最后基于重构样本集再次协同表示。这种基于近邻样本的二次稀疏重构表示法,使识别更精确,并在一定程度上提升了运行效率。在ORL,YALE,FERET及AR人脸数据库上通过仿真验证了该方法的有效性。  相似文献   

14.
稀疏表示近些年来被广泛用于人脸识别。由于在现实中,同类图像之间往往不可避免存在光照、姿态、甚至遮挡等差异,如果使用这些有各种差异的图像样本去表示某一特定状态下的图像,则表示的效果势必会受到影响。为进一步提高稀疏表示在人脸识别中的性能,基于原始协同分类(CRC)算法,引入近邻思想,即在各类训练样本中分别寻找与测试样本相近的若干样本,以构建新的近邻样本集;在此基础上进行协同表示,并利用每类样本系数分别重构待测样本,最后基于重构样本集再次协同表示。这种基于近邻样本的二次稀疏重构表示法,使识别更精确,并在一定程度上提升了运行效率。在ORL,YALE,FERET及AR人脸数据库上通过仿真验证了该方法的有效性。
  相似文献   

15.
 针对大规模数据集上的模式分类任务, 提出基于Parzen 窗核密度估计的模式分类隐私保护算法。利用Parzen 窗算法对原始大规模训练集服从的概率密度进行估计, 根据估计的概率密度函数构造la 个替换训练样本, 其中l 为原始样本的数目, a 通过10 折交叉验证方式确定。最后发布替换训练样本进行模式分类, 以实现原始数据上的隐私保护。在Adult 数据集上的仿真实验充分验证了算法的有效性。  相似文献   

16.
交叉覆盖算法分类时着重在于两类的交界部分,混杂在另外一类中往往无助于提高分类器的效率,反而会增加分类器的计算负担。本文提出一种基于交叉覆盖算法的最近邻交叉覆盖算法(NN-ACA):对进行训练的原始样本数据进行预处理,删除这些不同类的最近邻点,得到精简后的样本集,再对该样本集使用交叉覆盖算法。通过实验和与SVM的比较,结果表明NN-ACA在一定的样本规模表现了速度和分类正确性上的优越性。  相似文献   

17.
两层最近邻(TLNN)分类算法通过在有限训练样本条件下最小化错误率的平均绝对误差,能够产生比k-最近邻(kNN)算法更好的分类结果,但其精度易受噪声影响。针对这个问题,提出一种基于最佳距离度量的两层最近邻分类算法(ODM-TLNN),提高对噪声数据的鲁棒性。算法分为两层,下层使用最佳距离度量来确定一个未标记样本的局部子空间,上层采用AdaBoost在子空间进行信息提取。基于UCI数据集的实验结果表明,该算法能充分降低分类错误率,并且在噪声数据下具有较好的稳定性。  相似文献   

18.
K-最近邻的改进及其在文本分类中的应用   总被引:4,自引:0,他引:4  
采用K近邻算法(Knearest neighbors,简称KNN)进行分类时,如果训练样本数量太大,那么搜索测试样本的K个最近邻时,算法的计算量很大.本文针对KNN的不足提出了一种改进方法.改进的KNN算法通过定义样本的延拓类和延拓能力,保留延拓能力强的样本作为它延拓类中其它训练样本的代表,来缩减训练样本数量,达到减少算法计算量的目的.实验证明,改进的KNN算法具有很好的性能.  相似文献   

19.
为了提高最大散度差鉴别分析方法在人脸识别中的识别率,提出了一种改进的基于差空间的最大散度差鉴别分析人脸识别算法.该方法把类内平均脸方法应用到2DPCA算法中,并基于改进的2DPCA方法分别建立训练样本和测试样本的差空间,然后用类内中间值代替类内均值修改了最大散度差鉴别算法中类内散布矩阵的定义.用改进后的最大散度差鉴别法对得到的差空间进行鉴别分析,分别提取训练样本和测试样本的鉴别特征,用最近邻分类器分类.在ORL人脸数据库上的实验结果表明,该方法可以有效地改善识别率.  相似文献   

20.
基于整个数据集的稀疏表示(sparse representation classification,SRC)用于人脸识别在很大程度上影响了运行效率.如何利用较少样本稀疏表示在保证计算效率的同时,识别率也有一定提升,尤其是面对光照、角度、姿态等非受控环境,目前仍是一个问题.考虑到协同表示(collaborative representation classification,CRC)基于l2范数稀疏求解的优势,为进一步提升CRC的整体分类性能,引入类内近邻,提出一种二次近邻稀疏重构表示法.该方法首先在原始训练集上选择各类训练样本中与待测样本距离相近的若干样本组成近邻样本集,并协同表示,接着分别用各类近邻样本重构待测样本,再次选择与待测样本相近的若干重构样本协同表示,最终实现模式分类.在ORL和FERET数据库上的仿真实验表明,相比现有的一些CRC算法,该方法在一定程度上缩短了运行时间,并使识别更精确.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号