首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
传统的Boosting算法训练出的分类器常会出现过拟合和向多数类偏移.为此,提出一种基于自适应样本注入和特征置换的Boosting学习算法,通过在训练过程中加入人工合成样本,逐渐平衡训练集,并通过合成的样本对分类器学习进行扰动,使分类器选择更多有效的特征,提高了分类器的泛化能力.最后,在两类和多类图片分类问题上对该算法的有效性进行了考察,实验结果表明,该算法能够在样本数很少,且正负样本数量极不均衡的情况下,有效提高booting算法的泛化能力.  相似文献   

2.
提出一种应用于科技文献分类的文本特征选择方法.该方法运用了聚类与关联规则的思想,对文本特征进行逐层选择.同时为提高K-means算法的聚类性能,对K-means算法做了相应的改进,通过为算法的终止条件设定标准值来减少算法迭代次数,减少学习时间;通过删除由信息动态变化而产生的冗余信息,来减少动态聚类过程中的干扰.采用KNN分类器进行对比实验,实验结果表明,该特征选择方法在科技文献分类方面有较高的准确率.  相似文献   

3.
提出了一种基于分类算法的潜在好友推荐系统. 该系统采用两步特征方法处理原始数据集,去除不相关特征项和冗余特征项,为分类器提供精简的特征集合;把学者潜在好友推荐问题转化为二分类问题,对比4个常用分类器在两步特征选择方法上的分类效果,并找出推荐效果最佳的分类器(决策树分类器),同时得出学术社交网络中区分度最大的6个用户特征信息. 使用来自学术社交网络学者网(SCHOLAT)的社交网络信息作为实验原始数据集进行测试,实验结果显示,相比传统方法,基于分类的推荐方法在准确率和F1值均有显著提升,体现了基于分类算法的潜在好友推荐系统的准确性和实用价值.  相似文献   

4.
基于传统信息增益特征选择算法,通过提出类内分散度与类间集中度的概念,结合传统信息增益算法,解决了信息增益算法因忽略特征项的分布而导致的性能下降问题,提高了信息增益算法的效率.使用改进的特征选择算法进行垃圾邮件过滤实验,在不同的分类器下,与传统的特征选择算法进行对比,实验结果表明,改进的特征选择算法性能较优.  相似文献   

5.
基于主动学习SVM分类器的视频分类   总被引:4,自引:0,他引:4  
提出一种基于主动学习SVM分类器的视频分类算法.该算法分为两个步骤:首先分析并提取与视频类型有关的十维底层视觉特征;然后用SVM分类器建立这些底层特征与视频类型之间的联系.在获取SVM分类器所需的训练样本时,采用主动学习的方法选择对SVM分类器最"有用"的样本提供给用户进行标注,用更少的训练样本获得与大量训练样本近似的分类效果,从而减轻用户标注负担.针对多类SVM分类的主动学习问题,提出用后验概率计算分类器对未标注样本的置信度进行样本选择.实验结果表明,主动学习算法与随机采样标注的被动学习算法相比,在相同的训练样本情况下能够获得更高的分类精度;而基于后验概率选择样本的主动学习要略好于传统的基于变型空间(version space)选择样本的主动学习.  相似文献   

6.
研究了基于聚类技术提高分类器差异性的方法.通过Bootstrap技术与分类器学习算法训练分类器模型,利用分类器在验证集上的分类结果作为聚类的数据对象;然后应用聚类算法对这些数据聚类,并在每个簇中选择分类器代表模型,以此构成集成学习的成员;最后应用融合方法实验研究了基于聚类技术提高差异性的集成学习性能,并与集成学习方法bagging,adaboost进行了实验比较.  相似文献   

7.
为同时保证基分类器的准确性和差异性, 提出一种基于聚类和AdaBoost的自适应集成算法. 首先利用聚类算法将训练样本分成多个类簇; 然后分别在每个类簇上进行AdaBoost训练并得到一组分类器; 最后按加权投票策略进行分类器的集成. 每个分类器的权重是自适应的, 且为基于测试样本与每个类簇的相似性及分类器对此测试样本的分类置信度计算得到. 实验结果表明, 与AdaBoost,Bagging(bootstrap aggregating)和随机森林等代表性集成算法相比, 该算法可取得更高的分类精度.  相似文献   

8.
采用朴素贝叶斯分类器进行文本分类时,特征选择方法的好坏直接影响到分类器的性能.本文提出一种最大判别(MD)特征选择算法,由训练得到N个类的概率分布后,通过对样本进行测试并得到其特征向量d中每个特征词区分类别的能力,并构造出了一个新的特征向量ε用于分类,使得从中选取的部分特征词具有最大的类别区分能力.仿真结果表明,与cMFD,CSFS和CMFS三种特征选择算法相比,MD特征选择算法能在选取较少特征词情况下,获得更高的分类精度.  相似文献   

9.
综合考虑对海雷达目标识别的高实时性和强泛化能力要求,提出一种利用模拟退火算法(SA)进行集成间隔优化的静态选择集成(SSE)算法.该算法首先利用SA基于集成间隔最大化搜索出不同大小的最优基分类器子集,然后利用集成分类精确度从中筛选出最终的集成分类器系统.进而提出一种分类器权值、样本权值的迭代求解算法,并考虑这两类权值以及基分类器的分类置信度,给出了8种集成间隔定义.在自建全极化高分辨率距离像(HRRP)分类数据集和17个UCI数据集上分析了集成间隔定义对集成算法性能的影响,通过对比实验验证了该算法的有效性.  相似文献   

10.
提出一种基于多重假设检验的特征加权朴素贝叶斯分类算法, 该算法通过特征选择方法得到多个特征词集合, 再按多重假设检验错误率为每个特征词集合配以不同的权重系数并参与到分类器的构建中. 该方法已经应用到市长公开电话的文本分类中, 通过构建的3个特征加权朴素贝叶斯分类器实现了投诉文本的计算机自动分类, 且相对传统方法提高了分类器的效率和精度.  相似文献   

11.
隐写检测特征维数的增加,不仅增加了分类器训练时间和预测时间,甚至还会造成"维数灾难".因此,为达到特征降维的目的,对空域隐写检测特征选择进行研究,提出了一种基于条件互信息的特征选择算法.该算法首先选取一个与类标签具有最大互信息的特征,接着选取与此特征和类标签具有最大条件互信息的一个特征;然后通过前向寻找方式,从未选择特征子集中循环选取与刚选取特征和类标签具有最大条件互信息的特征,一直到选出规定数目的特征后结束循环.实验结果表明,与其他算法相比,所提算法取得了较好的特征选择效果.  相似文献   

12.
提出一种适用于超多类手写汉字识别的新改型Adaboost算法,采用基于描述性模型的多类分类器(modified quadratic discriminant function,MQDF)作为Adaboost基元分类器,可直接进行多类分类,无需将多类问题转化为多个两类问题处理,其训练复杂度大大低于已有的多类Adaboost算法。算法提出根据广义置信度更新样本权重,实验证明这种算法适用于大规模多类分类问题。为了降低算法的识别复杂度,提出从所有训练后得到的Adaboost基元分类器组中选择一个最优的基元分类器作为最终分类器的方法进行删减。在HCL2000及THOCR-HCD数据集上进行实验证明,所提改型Adaboost算法提高了识别率的有效性,该算法的相对错误率比现有最优算法分别下降了14.3 %,8.1 %和19.5 %。  相似文献   

13.
基于人工鱼群算法的储粮害虫特征选择   总被引:2,自引:1,他引:1  
储粮害虫特征选择是粮虫图像识别中的一个核心问题.提出基于人工鱼群算法的特征选择,并给出了基于二进制编码寻优的实现方法.以交叉验证训练模型的识别率作为特征子集的性能评价准则,将人工鱼群算法应用于粮虫的特征选择.该算法从粮虫的17维形态学特征中自动选择出面积、周长等7个特征所组成的最优特征子集,采用参数优化之后的SVM分类器对90个粮虫样本进行分类,识别率达到95.5%以上,并与PCA法、GA法和原始特征法进行对比,结果表明人工鱼群算法降低了特征空间的维数,提高了分类器的识别率,证实了基于人工鱼群算法的粮虫特征选择是可行的.  相似文献   

14.
张燕 《河南科学》2018,(1):11-16
针对网络行为数据的不均衡、数量大、更新快的问题,结合均衡化、增量学习、分类器集成思想提出一种用于网络入侵检测的协同增量支持向量机算法,该算法利用多个分类器的协同工作,提高算法速度,每个子分类器依据类样本的空间分布计算类样本错分代价,避免分类超平面偏移,对多个子分类器进行加权集成获得最终分类器,提高最终分类器在不均衡数据集下的分类性能.最后,在KDDCUP1999数据集上的仿真实验结果表明,该算法对整体准确率、少数类及未知攻击都有较高的检测准确率.  相似文献   

15.
朴素贝叶斯分类器是一种简单、高效的分类算法,它以贝叶斯定理和最大后验假设为理论基础,然而朴素贝叶斯分类器属性之间相互独立的假设,影响了朴素贝叶斯分类器的性能.提出先使用基于相关的属性选择算法进行属性选择,然后在选择的属性集上,用朴素贝叶斯分类器对数据集进行分类.实验证明,与未使用属性选择的实验结果相比,使用基于相关的属性选择算法进行属性选择后,朴素贝叶斯分类器平均分类正确率提高,分类效率显著提升.  相似文献   

16.
针对增强现实场景跟踪注册存在速度较慢等问题,提出了一种基于改进随机蕨的增强现实跟踪注册算法.该算法采用离线训练和在线跟踪两个模块.提出了一种嵌入式蕨分类器以提高特征点匹配精度,该分类器采用有监督的降维方法,并利用了所有可能的信息.通过该分类器进行特征匹配,进而计算摄像机位姿并渲染注册虚拟物体.实验结果证明,提出的嵌入式蕨在平均分类精度上优于其他算法.平均处理每帧图像的时间为34.22 ms,基本满足实时性.  相似文献   

17.
研究表明,具有较大边际分别的组合分类器泛化性能更高.根据该结论,论文构造了一个新的基于边际的度量指标(MM)以充分考虑基分类器和组合分类器的分类能力,进而提出了一种新的组合分类器选择方法.该方法初始化组合分类器为空(或满),迭代的加入(或移除)具有最大(或最小)MM值的分类器,以降低组合分类器规模并提高它的分类准确率.在随机选择的24个UCI数据集上的实验表明,与其他一些高级的贪心组合选择算法相比,该方法具有更好的泛化能力.  相似文献   

18.
基于纹理特征融合的煤矸石分选技术研究   总被引:1,自引:0,他引:1  
提出了一种新的基于纹理特征融合的煤矸石分选方法.设计了一种纹理特征提取算法.选取多个纹理特征作为分类器的输入特征,并对选择出的分类特征进行融合,最后采用神经网络分类器实现煤矸石的分选.实验结果表明,本文所提出的分选方法达到了较高的识别正确率,且能够满足实时要求.  相似文献   

19.
针对传统AdaBoost算法在人脸检测中训练耗时和误检率高的问题,提出一种改进的AdaBoost算法.新算法在基于PSO的AdaBoost算法基础上对弱分类器的选择和整合两个阶段进行改进.弱分类器选择阶段,在使用PSO迭代选择最佳弱分类器之前,剔除部分无用特征,缩小粒子搜索空间;弱分类器整合阶段,在采用基于核函数的非线性感知器算法优化调节弱分类器参数的过程中使用一种新的与正样本分类能力有关的弱分类器初始参数.采用基于MIT数据库的实验结果表明,本文算法比基于PSO的AdaBoost算法在检测性能上有明显提高.  相似文献   

20.
设计一种基于AP聚类算法和SVM分类器相融合的新的混合分类器, 使用AP聚类算法优化数据集, 得到了高质量、 小样本的SVM分类器训练集. 实验结果表明: 与传统的SVM分类器相比, 混合分类器具有更高的分类精度; 在心脏病预测上, 该分类器的效果较好.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号