首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 46 毫秒
1.
针对入侵检测的代价敏感主动学习算法   总被引:1,自引:2,他引:1  
入侵检测系统通过提供可能由恶意攻击导致的告警信息来保护计算机系统.为了能够利用历史数据自动提升入侵检测的性能,机器学习方法被引入入侵检测.但是,高质量训练数据的获取往往需要繁重的劳动或代价昂贵的监控过程.同时,不同类型的误分类导致的代价也是不一样的,入侵检测需要使误分类代价最小.针对这两种需要综合考虑的问题,提出一种基于代价敏感主动学习的入侵检测分类器构造方法ACS.该方法结合代价敏感学习和主动学习方法,其目标为减少学习代价敏感分类器的标注次数,使代价敏感分类器的误分类代价最小.该方法在主动学习的学习引擎中使用代价敏感学习算法替代传统的错误最小学习算法,同时在采样引擎中使用最大误分类代价的采样标准.ACS方法在主动学习中版本空间的构造、更新过程都针对代价敏感环境作了对应的改进,使该算法能够以较高的收敛速度收敛到误分类代价最小的目标函数.在入侵检测数据集KDDCUP99上的的实验表明,ACS方法能够有效地减少学习代价敏感分类器的标注次数.  相似文献   

2.
基于语音识别置信度的英语语言学习算法研究   总被引:2,自引:0,他引:2  
语音识别技术是实现一个语音学习系统的关键。由于目前的英语学习软件并不能完全满足用户的要求,因此该文提出了将语音识别置信度引入语言学习的方法。在讨论了置信度的基本原理和在语言学习中的作用之后,提出了一种新的算法并在此算法基础上最终建立了一个基于置信度技术的英语语言学习系统。在TIMIT语音库中的实验结果表明,语音识别置信度可以有效地提高语言学习系统的性能;当门限值设置于-0.7和-1.0之间,虚警率(false alarm)在1.1%左右,漏报率(false rejection)在0.65%左右,并且在一定条件下可以有效地反映学习者发音的质量,基本上可以达到实用的要求。  相似文献   

3.
《河南科学》2016,(9):1423-1427
为了提高大规模数据的分类性能,提出一种基于主动学习的有监督在线多核学习算法SOMK_AL(Supervised online multiple kernel learning algorithm based active learning).首先,采用主动学习的方法缩减数据规模.通过训练生成两个分类器,对读入数据xt进行预测,将两个分类器预测类别不一致的数据作为信息含量高的有标记数据,参与在线学习过程中的核更新;接着,在核集成过程中,通过随机抽样的方法构造核函数集的子集,仅仅在子集中实现核更新,缩减核更新的计算规模.最后,在大规模数据的基准数据集上进行实验,对提出的算法的有效性进行评估,结果表明SOMK_AL能较好地提高数据的分类性能.  相似文献   

4.
协同训练是一种流行的半监督学习算法,是目前机器学习和模式识别领域中的一个研究热点.基于差异性的协同训练利用分类器之间的差异性进行相互学习来提供性能.在对各种协同训练算法的分类差异性进行分析总结的基础上,提出了一种基于分类置信度差异最大化的协同训练算法.在12个UCI数据集上的实验表明,该算法优于标准协同训练算法co-training,从而验证了算法的有效性.  相似文献   

5.
6.
随机森林在分类不平衡数据时,容易偏向多数类而忽略少数类,可以将代价敏感用于分类器的训练,但在传统代价敏感随机森林算法中,代价函数没有考虑样本集实际分布与特征权重,且在随机森林投票阶段,没有考虑基分类器的性能差异。本文提出一种改进的代价敏感随机森林算法ICSRF,该算法首先根据不平衡数据集的实际分布构造代价函数,并将权重距离引入代价函数,然后根据基分类器的性能采取权重投票,提高分类准确率。实验结果表明,ICSRF算法能有效提高少数类的分类性能,可以较好的处理不平衡数据。  相似文献   

7.
为了改善立体匹配算法在低纹理和深度跳变区域的匹配性能,提出了一种改进的置信度传播立体匹配算法.首先利用均值漂移算法对图像进行彩色分割,然后通过自适应权重算法计算匹配代价并获取初始视差图,再利用匹配代价可信度检测和左右一致性校验将初始匹配结果按照可靠度分类,最后在全局优化的过程中分别通过可靠度分类和图像分割结果来指导置信...  相似文献   

8.
通过分析传统基于概率度量的K邻近置信度评估方法,提出一种基于最大差距的置信度评估方法,并在UCI数据集上对两种方法进行对比实验.实验结果表明,基于最大差距的置信度评估方法在宏平均召回率、宏平均精度及所用时间上均优于K邻近置信度评估方法,从而可进一步优化半监督分类学习中数据样本的置信度评估.  相似文献   

9.
弱监督场景下的标签噪声广泛存在于现实世界的数据中,导致分类性能下降。测量误差、主观标签偏差和人为标记错误都是导致噪声标签的主要原因。为降低噪声标签对模型分类性能的影响,该文提出一种噪声标签识别与纠正的置信度预测方法(CPRC)。首先,定义初始可信样本选择策略,筛选优质的可信样本;然后,建立置信度连接关系,设计标签概率预测方法,推断样本标签置信度;最后,迭代搜索最优置信度样本,实现噪声标签识别和纠正。该文选择在Seeds、Penbase等经典数据集上进行广泛实验,实验结果表明,该文算法可以显著提高不同类型基础分类器在不同噪声比下的分类性能,且性能优于目前先进的噪声标签学习算法。  相似文献   

10.
针对主动学习面向大型数据集人工标记成本过高和半监督自训练算法中存在误标记点影响的问题,提出了一种主动学习与半监督自训练交替迭代训练的联合算法.算法在训练过程中奇数轮次采用主动学习算法,偶数轮次采用自训练算法,通过2种算法的交替迭代训练以弥补彼此不足.自训练算法对无标记样本的预测减轻了主动学习标记样本的负担,同时主动学习标记易变成噪声的样本,减轻了自训练算法训练过程中对样本的标记错误.提出了一种基于密度峰值聚类和隶属度的改进主动学习算法:将初始无标记样本聚类成簇,根据隶属度差值在每个簇内选取部分样本做人工标记,获得可表达样本的整体结构的均衡样本.仿真试验表明:提出的联合算法在性能上要优于2种单一算法.对比常见的主动学习算法,改进后的主动学习算法分类性能得到显著提升,将其应用于联合算法中的效果更具优势.   相似文献   

11.
针对当前主动学习策略直接用于SVM(Support Vector Machine)分类器时存在的泛化能力不强的问题,提出的两层协同主动学习策略TLCALS (Two-Level Collaboration Active Learning Strategy)应用了协同训练的思想,能深层挖掘未标记样本数据的分布知识.实验表明,TLCALS策略能够合理指定TSVM (Transducive Support Vector Machine)算法中的正样本数,在典型指标测试中都表现出了一定的优越性.  相似文献   

12.
在进行机械结构可靠性分析时,由于很多工程问题的性能函数较为复杂,计算成本很高,所以常采用代理模型拟合隐式性能函数来降低计算成本.为了能够利用较少的样本信息,获得较高的可靠度计算精度,将Kriging代理模型与学习函数相结合,提出一种主动学习可靠性分析计算方法.该方法找出学习效果最好的样本点对Kriging模型进行更新,...  相似文献   

13.
针对多传感器一致性测度的研究多集中于对某一时刻多传感器观测结果的判断,并未考虑时间序列的影响,导致某一时刻的一致性测度结果并不可信的问题,在传统的一致性测度基础上,采用一致性测度结果队列的中值作为测度结果的鲁棒估计,采用一致性测度结果队列的方差描述测度结果的稳定性,实现对一致性测度结果进行可信度评价,从而获得对传感器观测结果可靠性更好、可信度更高的评估.仿真实验表明,通过对多传感器观测数据的一致性测度结果进行可信度加权,可以显著提高一致性测度的鲁棒性,可以消除由于传感器性能不稳定带来的影响,有效识别出性能不稳定的传感器并将其剔除,为数据融合提供一致性传感器组.  相似文献   

14.
一种基于KNN的半监督分类改进算法   总被引:1,自引:0,他引:1  
本文提出一种新的基于KNN分类的半监督学习self-training改进算法,并以多个UCI数据集为实验,对基于KNN的半监督分类模型算法进行改进,充分利用已知类别标签数据的正确知识进行自训练,以得到最终分类结果.实验结果表明,该方法能显著提高分类准确率.  相似文献   

15.
根据主动学习可以有效地减少标注样本的代价这一特点,设计了一种基于SVM的主动学习方法.仿真实验中,检验分类正确率和F测度这两类评估指标,结果表明基于SVM的主动学习的学习效果优于被动学习.  相似文献   

16.
针对当前网络入侵具有多样性和易变性, 单一方法很难获得理想网络入侵检测结果的问题, 为提高网络入侵检测正确率, 有效拦截各种网络入侵, 提出一种将半监督技术与主动学习相结合的网络入侵检测方法. 首先, 采集网络入侵数据, 提取网络入侵特征, 并采用半监督技术根据特征对网络入侵数据进行聚类处理; 其次, 采用主动学习算法对聚类后的数据进行训练, 构建网络入侵检测的分类器, 并引入蚁群算法对构建网络入侵检测的分类器进行优化; 最后, 采用标准数据集对网络入侵检测方法进行仿真测试. 测试结果表明, 该方法解决了当前入侵检测方法存在的缺陷, 提升了网络入侵检测正确率, 漏检率和误检率明显少于经典网络入侵检测方法, 同时缩短了网络入侵检测时间, 改善了网络入侵检测效率, 能更好地保证网络通信和数据传输安全.  相似文献   

17.
基于贝塔分布的概率特征性质,该文研究了一类特殊的贝塔分布的最优区间估计; 进而,将得到的区间估计与等尾置信区间进行了比较.结果表明:使用最短置信区间作为未知参数的区间估计,估计的精度得到显著提高.最后,利用数值模拟的方法给出了贝塔分布的最短区间估计用表.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号