首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
随机森林在分类不平衡数据时,容易偏向多数类而忽略少数类,可以将代价敏感用于分类器的训练,但在传统代价敏感随机森林算法中,代价函数没有考虑样本集实际分布与特征权重,且在随机森林投票阶段,没有考虑基分类器的性能差异。本文提出一种改进的代价敏感随机森林算法ICSRF,该算法首先根据不平衡数据集的实际分布构造代价函数,并将权重距离引入代价函数,然后根据基分类器的性能采取权重投票,提高分类准确率。实验结果表明,ICSRF算法能有效提高少数类的分类性能,可以较好的处理不平衡数据。  相似文献   

2.
随机森林在分类不平衡数据时,容易偏向多数类而忽略少数类。可以将代价敏感用于分类器的训练;但在传统代价敏感随机森林算法中,代价函数没有考虑样本集实际分布与特征权重,且在随机森林投票阶段,没有考虑基分类器的性能差异。提出一种改进的代价敏感随机森林算法ICSRF,该算法首先根据不平衡数据集的实际分布构造代价函数;并将权重距离引入代价函数,然后根据基分类器的性能采取权重投票,提高分类准确率。实验结果表明,ICSRF算法能有效提高少数类的分类性能,可以较好地处理不平衡数据。  相似文献   

3.
提出了一种自适应代价优化算法ACO,利用"登山式"方法查找最适合重采样数据子集的最优误分类代价值用于建立基分类器,克服了固定式误分类代价不尽科学和客观的缺点,利用重采样技术实现了数据集样本不足时的分类器训练.通过"投票"方式对原始数据集中的实例重新标记类标,学习得到一个适应于类分布不均衡数据集的自适应的集成分类器.实验证明,用自适应代价优化算法实现的分类器在类分布不均衡的数据集上的分类性能明显优于CSC,MetaCost和naive Bayes等建立的分类器.  相似文献   

4.
针对代价敏感学习问题,研究boosting算法的代价敏感扩展。提出一种基于代价敏感采样的代价敏感boosting学习方法,通过在原始boosting每轮迭代中引入代价敏感采样,最小化代价敏感损失期望。基于上述学习框架,推导出两种代价敏感boosting算法,同时,揭示并解释已有算法的不稳定本质。在加州大学欧文分校(University of California,Irvine,UCI)数据集和麻省理工学院生物和计算学习中心(Center for Biological&Computational Learning,CBCL)人脸数据集上的实验结果表明,对于代价敏感分类问题,代价敏感采样boosting算法优于原始boosting和已有代价敏感boosting算法。  相似文献   

5.
AdaBoost作为一种有效的集成学习方法,能够明显提高不稳定学习算法的分类正确率,但对稳定的Naive Bayesian分类算法的提升效果却不明显.为此,利用多种特征评估函数建立不同的特征视图,生成多个有差异的加权朴素贝叶斯(WNB)基分类器;尝试使用几种不同的方式将样本权重嵌入WNB基分类器的参数中,对WNB产生扰动,进一步增加基分类器的不稳定性.实验结果表明,对比AdaBoost所提算法,BoostMV-WNB能够明显提升WNB文本分类器的性能.  相似文献   

6.
目前大部分分类器都是以分类正确率来衡量性能,这种评价标准都是基于理想情况下所有错误分类代价都是相同的。但实际生活中往往不同的错误分类会带来不同的损失,因此代价敏感学习成为模式识别中一个热点研究领域。本文将代价敏感思想与矩阵型学习机相结合,提出了一个矩阵型多类代价敏感分类器模型。通过与其他分类器在常用数据集上的对比实验证明,该方法降低了错误分类代价,提高了少数类或代价高类别的分类正确率,并可以在有效次内收敛,是一个有效且实用的方法。  相似文献   

7.
针对人脸识别系统中采用的AdaBoost算法存在特征冗余的缺点,采用进化算法对其优化,消除冗余.首先采用AdaBoost算法提取类Harr小波特征,然后采用进化算法在低维的AdaHarr特征空间中寻找全局最优解,得到相应的弱分类器及其权重与阈值,将其加权求和得到最优的强分类器,以此建立最优人脸识别系统.对提出的算法进行测试,结果表明,在人脸识别系统中,基于进化算法的AdaBoost算法比优化前算法的弱分类器数量与正确率均得到提升,可见该算法能改善人脸识别系统的性能.  相似文献   

8.
为同时保证基分类器的准确性和差异性, 提出一种基于聚类和AdaBoost的自适应集成算法. 首先利用聚类算法将训练样本分成多个类簇; 然后分别在每个类簇上进行AdaBoost训练并得到一组分类器; 最后按加权投票策略进行分类器的集成. 每个分类器的权重是自适应的, 且为基于测试样本与每个类簇的相似性及分类器对此测试样本的分类置信度计算得到. 实验结果表明, 与AdaBoost,Bagging(bootstrap aggregating)和随机森林等代表性集成算法相比, 该算法可取得更高的分类精度.  相似文献   

9.
针对入侵检测的代价敏感主动学习算法   总被引:3,自引:2,他引:1  
入侵检测系统通过提供可能由恶意攻击导致的告警信息来保护计算机系统.为了能够利用历史数据自动提升入侵检测的性能,机器学习方法被引入入侵检测.但是,高质量训练数据的获取往往需要繁重的劳动或代价昂贵的监控过程.同时,不同类型的误分类导致的代价也是不一样的,入侵检测需要使误分类代价最小.针对这两种需要综合考虑的问题,提出一种基于代价敏感主动学习的入侵检测分类器构造方法ACS.该方法结合代价敏感学习和主动学习方法,其目标为减少学习代价敏感分类器的标注次数,使代价敏感分类器的误分类代价最小.该方法在主动学习的学习引擎中使用代价敏感学习算法替代传统的错误最小学习算法,同时在采样引擎中使用最大误分类代价的采样标准.ACS方法在主动学习中版本空间的构造、更新过程都针对代价敏感环境作了对应的改进,使该算法能够以较高的收敛速度收敛到误分类代价最小的目标函数.在入侵检测数据集KDDCUP99上的的实验表明,ACS方法能够有效地减少学习代价敏感分类器的标注次数.  相似文献   

10.
为了提高代价敏感分类算法MetaCost的准确率,降低错分代价,提出了多类别问题下的一种代价敏感分类算法(简称D-MetaCost算法).该算法利用MetaCost算法,通过多次取样生成多个模型,依据它们的分类准确率,选择其中准确率较高的前几个基分类器,将它们与最后阶段新生成的分类器聚集在一起得到最终分类模型.实验表明,D-MetaCost算法在准确率和代价方面比经典的MetaCost算法有明显的改进和提高.  相似文献   

11.
在雷达自动目标识别(radar automatic target recognition ,RATR)领域,为了保证基于高分辨距离像(high-resolution range profile,HRRP)的目标识别算法在进行小样本多类目标识别时仍然具有优异的识别性能,需要提出一种同时具备优异泛化性能与低运算复杂度的识别算法。利用比值计算两个向量之间的比值距离,并将比值距离应用于距离分类器中,称之为D距离分类器。然后利用八类地面目标实测数据将D距离分类器与其他一些RATR统计模型进行比较,分别分析其在小样本与多类目标时的识别精度。最终结果验证出D距离分类器在训练样本有限且多类目标识别时仍然具有优异的泛化性能与很低的运算复杂度。   相似文献   

12.
支持向量机(SVM)是建立在统计学习理论的基础上的一种小样本机器学习方法,它是针对二分类问题而提出的,如何将二分类问题有效地推广至多分类问题是支持向量机研究的重要内容之一.介绍了现有提出的一些支持向量机多分类的方法,并比较其优缺点,在模糊支持向量机的基础上提出具有去噪声的模糊支持向量机的多分类的方法.  相似文献   

13.
一种新的多类SVM方法及其在文本分类中的应用   总被引:2,自引:6,他引:2  
提出一种将SVM扩展到多类文本分类问题的新方法,此方法有增量模式及批模式两种应用途径。其中,批模式提供了一种其他多类SVM替代方法;而增量模式在重复利用原有模型的基础上将新增类别的知识信息以增量方式更新到分类系统,整个分类器不需要全部重新学习,需要的计算量较小。实验表明增量方法大大减少新类增加时分类器更新所需要的学习步骤和时间;两种模式的分类效果与其他方法相当。  相似文献   

14.
在二叉树结构支持向量机(SVM)多分类算法的基础上,针对二叉树算法中点和叶盲目划分的问题,提出了一种新的二叉树SVM多分类算法.该算法通过标记划分的方法,一方面解决了盲目划分的问题,另一方面大大减少了子分类器的数目,大幅度提高了算法的速度.实验结果表明,该算法具有一定的优越性.  相似文献   

15.
一种基于多分类支持向量机的网络入侵检测方法   总被引:11,自引:0,他引:11  
构造了一种基于异构数据距离的径向基核函数,可直接应用于异构的网络数据,并利用实验数据得到修正的基于异构数据距离的径向基核函数(I-HVDM-RBF),从而减少了支持向量的个数,降低了运算量,采用I-HVDM-RBF核函数和一对一方法构造了多分类支持向量机来进行网络入侵检测,检测选用美国国防部高级研究计划局入侵检测评测数据,结果表明:与Ambwani方法比较,其检测精度提高了约3%,支持向量个数减少了268个,检测时间缩短了5min;与Lee方法比较,其拒绝服务攻击、远程到本地攻击和普通用户到超级用户攻击的检测精度分别高出73%、19%和3%。  相似文献   

16.
提出一种新的多分类最大间隔孪生支持向量机算法.该算法通过引入间隔以结构风险最小为优化目标建立 分类模型,并采用一对一对余的结构训练子分类器.仿真实验和真实数据实验表明:所提算法能有效提高模型的泛 化性能.  相似文献   

17.
支持向量机多类分类方法研究   总被引:1,自引:0,他引:1  
系统地回顾了现有的支持向量机多类分类方法,通过对其原理和实现方法的分析,从训练速度、分类速度和推广能力3个方面对这些方法的优缺点进行了归纳和总结,并得出相关结论.  相似文献   

18.
针对多业务LEO卫星网络中频繁切换所带来的通信链路保持问题,提出了基于概率的带宽自适应预留策略(APRS).该策略根据LEO卫星网络中地面终端运动的确定性与可预测性,利用终端发生切换的概率为即将到达小区的呼叫进行非全额带宽预留,并基于系统切换性能对预留带宽进行实时自适应调整.文中还给出了该策略在多业务条件下的具体实施方法,并通过仿真验证了APRS的有效性.仿真结果表明,APRS能够在不同用户QoS要求的多业务环境下合理预留、分配带宽,为用户提供满意的QoS,增大系统资源利用率.  相似文献   

19.
基于支持向量机的多类数字调制方式自动识别算法   总被引:4,自引:0,他引:4  
为了解决软件无线电系统中多种调制方式之间切换的问题,提出了一种基于支持向量机的多类数字调制方式识别算法.该算法通过提取有效的特征向量以区分不同的调制方式,并基于支持向量机和判决树分类思想,将特征向量映射到高维空间中加以分类。解决了样本在低维空间中的非线性不可分问题,避免了判决门限的确定,与传统的神经网络方法相比,具有更好的泛化推广能力.仿真结果表明,在具有加性带限高斯噪声的环境下,信噪比大于等于10dB时,识别正确率大于90%.  相似文献   

20.
本文介绍单片机在信号检测中的应用,提出一种用软件实现等精度计数器的方法.设计 中充分发挥单片机的特点和内部资源.使软、硬件结构均较简单,  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号