首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
为了提高半监督分类的有效性,提出一种基于交叉验证思想的半监督分类方法(CV-S3VM)。通过对未标记样本进行伪标记,将伪标记后的样本加入到标记样本集中,参与交叉验证,选取能使SVM分类器误差最小的标记作为最终的标记,实现对未标记样本进行标记。依次挖掘未标记样本的隐含信息,增加标记样本的数目。使用UCI数据集模拟半监督分类实验环境,结果表明CV-S3VM具有较高的分类率,在标记样本较少的情况下效果更为明显。  相似文献   

2.
基于主动学习SVM分类器的视频分类   总被引:4,自引:0,他引:4  
提出一种基于主动学习SVM分类器的视频分类算法.该算法分为两个步骤:首先分析并提取与视频类型有关的十维底层视觉特征;然后用SVM分类器建立这些底层特征与视频类型之间的联系.在获取SVM分类器所需的训练样本时,采用主动学习的方法选择对SVM分类器最"有用"的样本提供给用户进行标注,用更少的训练样本获得与大量训练样本近似的分类效果,从而减轻用户标注负担.针对多类SVM分类的主动学习问题,提出用后验概率计算分类器对未标注样本的置信度进行样本选择.实验结果表明,主动学习算法与随机采样标注的被动学习算法相比,在相同的训练样本情况下能够获得更高的分类精度;而基于后验概率选择样本的主动学习要略好于传统的基于变型空间(version space)选择样本的主动学习.  相似文献   

3.
为解决油层识别中存在的获得有标记数据的代价过高,有标记数据稀少的问题,提出一种新的基于分支定界的半监督支持向量机(branch and bound for semi-supervised support vector machine,BBS3VM)的油层识别方法。此方法主要将半监督学习(semi-supervised learning, SSL)和分支定界的思想引入到支持向量机(support vector machine, SVM)分类算法中。通过半监督学习的思想,使用大量未标记的样本来改善学习性能,利用分支定界算法提高半监督支持向量机(semi-supervised support vector machine,S3VM)算法的分类精度,将此改进算法应用于测井数据挖掘中的油层识别。经过对某油田的实际测井资料进行处理,实验结果表明,半监督油层识别方法要优于传统的S3VM分类算法,识别率更高,分类效果更显著,与全监督的SVM算法相比较,得到相差不大的分类精度的同时,速度更快。  相似文献   

4.
半监督学习在入侵检测系统中的应用   总被引:1,自引:0,他引:1  
提出了一种基于半监督模糊聚类的异常入侵检测方法,半监督学习算法的训练样本包括已标记数据和未标记数据,在训练系统模型时使用少量已标记样本和大量未标记样本作为种子初始化入侵检测系统的分类器,在少量已标记数据的约束下利用模糊C均值方法生成聚类,无需提供大量标记数据,不易陷入局部最优.实验表明,与FCM算法相比具有较高的性能.  相似文献   

5.
支持向量机(SVM)花费大量时间用于对非支持向量样本的优化.根据支持向量都是位于两类边界的靠近分类超平面的样本点,本文提出首先利用基于中心距离比值法排除大部分远离分类超平面的样本,然后以最小类间距离样本数作为测度进一步选择边界样本.得到包含所有支持向量的最小样本集,构成新的训练样本集训练SVM.将提出的算法应用于解决医学图像奇异点检测问题.实验结果表明.该算法减小了训练样本集的规模,有效地缩短了SVM训练算法的时间.同时获得了较高的榆出率.  相似文献   

6.
基于驾驶模拟平台设计实验方案,同步采集驾驶员的驾驶操作信息和车辆状态信息,选取6个表征驾驶风格的特征参数,采用主成分分析(Principal Component Analysis,PCA)算法对多元特征参数进行特征提取,将前3个主成分作为驾驶风格识别模型的特征输入.利用K-means聚类完成样本标记工作.基于有监督支持向量机(Support Vector Machine,SVM)与多分类半监督学习算法(i MLCU)的原理,分别建立SVM与i MLCU驾驶风格识别模型,通过调节标记样本与未标记样本比例,对比使用不同样本比例训练的SVM和i MLCU模型的驾驶风格识别准确率.结果表明:相比于SVM,i MLCU表现出了更优异的驾驶风格识别能力,由此可知半监督i MLCU模型可以利用未标记样本提高模型对驾驶风格的识别能力.  相似文献   

7.
针对高光谱影像处理应用中,标记样本往往数量较小且质量不均而未标记样本大量存在的问题,结合半监督学习方法,提出一种面向高光谱影像分类的半监督极限学习机分类算法.首先根据图理论,联合高光谱影像空间光谱信息,对标记和未标记样本共同构建无向加权图;然后,考虑平滑性约束和结构最小化原则,构造分类目标函数;最后,利用核方法求解最优参数,进而实现高光谱影像的半监督分类.采用该方法进行分类对比实验,结果表明:该方法能够有效利用未标记样本信息,提高小样本下的高光谱影像分类精度.  相似文献   

8.
为了提高半监督分类性能,提出了一种多分类器协同的半监督分类算法SSC_MCC.算法采用双层结构集成,使用多条件判断挖掘未标记样本信息,扩充有标记样本.第一层中,采用三分类器协同投票一致策略实现对未标记样本进行标记,第二层中采用基于正确分类率的分类器加权投票决策标记未标记样本,扩充有标记样本,用最终生成的有标记样本训练分类器,实现半监督分类.最后,使用UCI数据集模拟半监督实验,结果表明SSC_MCCL较好地提高了半监督分类性能.  相似文献   

9.
在保证分类性能的前提下,如何从大量的训练样本集合中选择重要样本子集,是模式分类中的一个重要问题.基于该问题提出了一种新的样本选择算法,并将该算法应用于文本分类,在标准文档集Reuters-21578、复旦文档集和20newsGroup新闻组文档集上进行了实验.实验结果表明:该方法能有效地选取边界样本,且采用SVM和KNN分类能得到较好的分类结果,尤其是在不均衡文档集上效果更佳.  相似文献   

10.
为解决入侵检测训练集(通常包含大量无标记样本和少量已标记样本),在传统半监督支持向量机(S3VM)上确定最优分类决策面,提出一种优化的多分类决策S3VM方法(MLL_S3VM)。该方法结合启发式搜索和聚类方法筛选出差异性较大的分类决策面,采用距离向量法对未标记样本进行标记。实验结果表明,在入侵检测中,该算法明显提高了模型预测精确度。  相似文献   

11.
为提高少量样本情况下分类器的性能,提出一种基于多分类器协同的半监督样本选择方法,利用未标注样本实现样本增强,提高分类器泛化能力.依靠多分类器的互相监督和多分类器标签一致的原理,将已标记样本作为训练集,利用SVM和RF两个分类器协同训练,多分类器的类别标签和确定度值作为约束条件,从未标记样本集中筛选出最有代表性的样本构成增强样本集,以准确率为评价标准,验证本算法对分类器泛化性能的影响.本算法在手写数字数据集(Mnist字符库)和Landsat土壤数据集上测试,实验结果表明相比少量原始训练样本构建的分类器,增强样本构建分类器预测的全部类别准确率都得到提升.两个数据集的总体准确率分别提升5.97%和7.02%,Mnist数据集中数字5这类准确率提升最高(提升11.9%,从79.3%到91.2%),Landsat土壤数据集中土壤3这一类准确率提升最明显(提升15.8%,从73.5%到89.3%),结果证明了该算法显著提高了分类器的泛化性能.同时与经典的KNN、Co-training和Co-forest算法对比,所提出的算法能够最大限度地利用未标记样本信息,具有最好的精度表现,证明了该研究提出算法的优越性.  相似文献   

12.
SVM-KNN分类器在网页分类中的应用   总被引:1,自引:1,他引:0  
为了提高中文网页自动分类的分类精度,将SVM-KNN方法用于中文网页分类.提出了一种中文网页的表示方法,在将下载的网页全部表示为向量空间的向量后,用SVM构造了一个多类分类器.在分类时通过在特征空间计算网页所表示的向量和分界面的距离决定采用SVM方法还是KNN方法对其分类.实验证明该方法是一种有效的方法,对网页分类的各类,使用该方法均比使用SVM方法具有更高的分类精度,同时能缓解SVM训练时对核参数的选择困难问题.  相似文献   

13.
基于两步策略的中文短文本分类研究   总被引:3,自引:0,他引:3  
为更好地挖掘文本信息,研究了将两步策略用于中文短文本分类的3个关键问题,提出了基于组合朴素贝叶斯(NB)和K近邻(KNN)分类器的两步中文短文本分类方法:(1)直接利用NB和KNN的输出构造其对应的二维空间,根据该空间内错误文本的分布将测试文本集分为3部分:能被KNN可靠分类的文本集A,不能被KNN可靠分类但能被NB可靠分类的文本集B,其他文本集C.(2)用KNN、NB分别对文本集A和B进行分类,根据训练语料的类别分布,直接给属于文本集C的文本分配标签.与NB、KNN和支持向量机(SVM)的对比实验表明,该方法可获得较高的分类性能.  相似文献   

14.
针对当前主动学习策略直接用于支持向量机(SVM)分类器时存在泛化能力不强的问题,提出了两层主动学习策略(TLAC),该策略利用协调训练的思想,深层挖掘未标记样本数据的分布知识,从而选择最有利于分类器性能的样本来训练分类器.实验表明,该TLAC策略能够合理地指定TSVM算法中的正样本数,在典型指标测试中都表现出了一定的优越性.  相似文献   

15.
为降低训练分类器的运算复杂度,并解决支持向量机(SVM)对多类分类问题没有特别有效解决方法的问 题。提出了一种基于一类支持向量机的多分类贝叶斯算法,证明了基于径向基核函数的一类SVM的分类函数归 一化为密度函数,并将所得的概率密度函数用于构造二分类及多分类贝叶斯分类器。仿真实验将提出的多分类贝 叶斯算法应用于多类通信信号调制识别,结果表明:该算法的分类准确率不低于传统SVM多分类器,而在多类属、 每类训练样本数目较大的情况下训练所需的运算量和存储量仅是传统SVM多分类算法的0.5%大大减小了核 矩阵规模和  相似文献   

16.
一种新的 SVM 决策树   总被引:3,自引:0,他引:3       下载免费PDF全文
SVM在小训练样本、高维情况下具有很好的泛化性能,但它不适用于多类分类.本文分析基本的SVM和多类SVM分类器,重点讨论了SVM决策树,提出了一种结点分类器类集合划分方案来构造SVM决策树.实验结果表明,以这种方法构造的SVM决策树分类器分类性能较好.  相似文献   

17.
基于随机森林的文本分类模型研究   总被引:3,自引:0,他引:3  
随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.随机森林模型是决策树的集成,并且由一随机向量决定决策树的构造.当森林中的决策树的数目增大,随机森林的泛化误差将趋向一个上界.将随机森林模型应用于文本分类,在Reuter21578数据集上的实验表明,分类效果比较好,性能比较稳定,将共同C4.5,KNN,SM0,SVM4种典型的文本分类器进行了比较,结果显示它的分类性能胜于CA.5,同KNN,SMO和SVM方法相当.  相似文献   

18.
为了挖掘人脸美丽的内在本质,本文提出了基于深度自编码器的人脸美丽吸引力预测模型:首先利用大量无标签人脸图像数据对深度自编码器进行预训练,然后结合Polak-RibierePolyak共轭梯度反向传播算法对深度自编码器的权值进行微调,从而建立深度自编码器的人脸美丽特征提取模型.最后经过支持向量机(SVM)分类器对人脸图像进行美丽预测.实验结果显示SVM分类器预测的平均识别率为77.3%,表明深度自编码器用于人脸美丽吸引力预测是有效的.  相似文献   

19.
为了提高贵妃芒果检测与分级的准确率和效率,首先用标定好的工业相机对芒果进行拍照,然后使用HALCON对芒果图像进行灰度化和图像分割预处理,接着提取芒果面积、果形指数、成熟度、缺陷面积和缺陷个数5个特征参数并归一化,把它们分别作为GMM、MLP、SVM和KNN分类器的输入向量,并以芒果的4个等级作为分类器的输出向量,最后以每级120个训练样本,60个测试样本分别对4种分类器进行训练和测试。结果表明4种分类器的平均准确率依次为92.5%、93.75%、98.75%和98%,准确率较高,有一定的实际应用价值。  相似文献   

20.
利用基于阈值聚类算法首先对带类标记的样本数据集进行有指导性聚类,其主要目的是压缩训练数据集,解决KNN分类算法的样本选择问题以及孤立点的发现,用少量的更具代表性的聚类中心替代KNN算法中巨大的样本集,然后利用聚类密度改进KNN分类算法,从而提高KNN分类检测的准确度和速度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号