首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
电信客户信用风险等级评估是对电信客户的信用风险进行等级分类. 针对建立客户信用风险等级分类模型时,大量带有类标注数据难以获得的问题,提出了基于主动学习的分类器建模方法,并对基于QBC(委员会投票选择)的主动学习算法进行改进以提高分类器的预测精度. 通过对实际电信客户数据进行信用风险等级建模实验,结果表明:应用新算法,分类器使用了较少的带类标签样本数据,达到了与被动学习相同的精度,大大降低了信用专家评估数据的工作量.  相似文献   

2.
针对传统集成学习方法运用到木马流量检测中存在对训练样本要求较高、分类精度难以提升、泛化能力差等问题,提出了一种木马流量检测集成分类模型。对木马通信和正常通信反映在流量统计特征上的差别进行区分,提取行为统计特征构建训练集。通过引入均值化的方法对旋转森林算法中的主成分变换进行改进,并采用改进后的旋转森林算法对原始训练样本进行旋转处理,选取朴素贝叶斯、C4.5决策树和支持向量机3种差异性较大的分类算法构建基分类器,采用基于实例动态选择的加权投票策略实现集成并产生木马流量检测规则。实验结果表明:该模型充分利用了不同训练集之间的差异性以及异构分类器之间的互补性,在误报率不超过4.21%时检测率达到了96.30%,提高了木马流量检测的准确度和泛化能力。  相似文献   

3.
提出了一种新的基于加权投票准则集成的极化合成孔径雷达系统(PolSAR)图像分类方法.该方法采用加权投票集成的方法根据不同个体的学习结果进行合,并从而提高极化SAR图像的分类精度.首先,输入极化图像数据并获得所需要的特征作为特征集.再从图像的每一类中选取多组像素点组成多个训练样本子集;然后,基于不同的样本子集训练学习得到不同的分类器,并对像素点进行分类得到预测标记,再由这些预测标记计算得出相应的加权系数;最后,通过加权系数将预测标记合并起来得到最终的极化SAR分类结果.实验结果证明,所提出的算法在AIRSAR和Radarsat-2数据上取得了很好的分类结果.  相似文献   

4.
给出低熵情况下的多键排序改进算法.利用众数投票算法结合中位数选择算法产生枢纽元,对与枢纽元相等的元素使用改进算法,其他元素仍采用原算法.理论分析表明,重复数据较多时改进算法速度较快,且在数据量不大时其性能接近线性算法.  相似文献   

5.
基于主动学习SVM分类器的视频分类   总被引:4,自引:0,他引:4  
提出一种基于主动学习SVM分类器的视频分类算法.该算法分为两个步骤:首先分析并提取与视频类型有关的十维底层视觉特征;然后用SVM分类器建立这些底层特征与视频类型之间的联系.在获取SVM分类器所需的训练样本时,采用主动学习的方法选择对SVM分类器最"有用"的样本提供给用户进行标注,用更少的训练样本获得与大量训练样本近似的分类效果,从而减轻用户标注负担.针对多类SVM分类的主动学习问题,提出用后验概率计算分类器对未标注样本的置信度进行样本选择.实验结果表明,主动学习算法与随机采样标注的被动学习算法相比,在相同的训练样本情况下能够获得更高的分类精度;而基于后验概率选择样本的主动学习要略好于传统的基于变型空间(version space)选择样本的主动学习.  相似文献   

6.
现有带钢表面缺陷在线识别系统中单个分类器对部分缺陷识别率不高,并且对训练样本依赖性较大;针对这一问题,提出了一种基于并行多分类器集成技术的带钢缺陷图像识别方法.该方法选择LVQ神经网络、RBF神经网络和支持向量机作为基分类器,应用加权投票法对基分类器进行集成,从而实现基分类器能力互补.实验表明,采用多分类器集成的带钢表面缺陷图像识别方法可以更准确地对带钢常出现的边缘锯齿、焊缝、夹杂、抬头纹等缺陷进行识别,能够得到相当或优于任何单个分类器的分类精度,总体识别率达到96%以上.  相似文献   

7.
《河南科学》2016,(1):22-27
针对数据集中类样本不均衡、样本标注代价大的问题,结合聚类算法、委员会投票思想和TSVM算法,提出一种基于聚类和协同标注的TSVM算法,该方法利用聚类算法进行子集划分,保证每个子集都包含良好的空间信息,对样本的标注采用多个分类器进行投票,提高标记准确率,减少错误的累积和传递,提高标注准确率,增强最后分类器的泛化性能.KDDCUP99数据集上的实验结果表明该方法对未知攻击有较高的检测准确率.  相似文献   

8.
为同时保证基分类器的准确性和差异性, 提出一种基于聚类和AdaBoost的自适应集成算法. 首先利用聚类算法将训练样本分成多个类簇; 然后分别在每个类簇上进行AdaBoost训练并得到一组分类器; 最后按加权投票策略进行分类器的集成. 每个分类器的权重是自适应的, 且为基于测试样本与每个类簇的相似性及分类器对此测试样本的分类置信度计算得到. 实验结果表明, 与AdaBoost,Bagging(bootstrap aggregating)和随机森林等代表性集成算法相比, 该算法可取得更高的分类精度.  相似文献   

9.
基于Fuzzy集的Vague集的模糊熵   总被引:36,自引:1,他引:36  
给出了Vague集的基本概念,阐述了Vague集的本质及Vague集与Fuzzy集之间的关系;通过对投票模型的分析,指出了在投票模型中投中立票者仍然有某种倾向,且该倾向由投赞成票和投反对票的人类之比来决定,在此基础上提出了一种Vague集向Fuzzy集转化的方法,最后给出了基于这种转化方法的Vague集模糊熵的定义。  相似文献   

10.
在情感分析研究中,使用Stacking算法进行情感分析时基学习器的选择是至关重要的。传统的Stacking算法仅仅只是将不同学习器结合起来,没有区分它们之间的不同,同时也不能反映初级学习器的实际预测情况,针对此问题,基于熵值法改进Stacking算法进行文本的情感分类。首先,使用熵值法确定单一分类器的性能指标权重,将指标值的权重进行加权求和获得不同模型的综合得分,通过综合得分来选择性能最好的基学习器组合;接着,由于基模型中的各个分类器性能的不同,将基学习器训练后的预测结果赋予不同的权重,输入到次级学习器当中;最后再利用次级学习器进行训练并预测情感倾向。实验结果表明,基于熵值法改进Stacking模型优于传统的Stacking模型,说明基学习器的选择和重要程度对情感分类具有一定帮助,为之后文本情感分析奠定一定的基础。在情感分析研究中,使用Stacking算法进行情感分析时基学习器的选择是至关重要的。传统的Stacking算法仅仅只是将不同学习器结合起来,没有区分它们之间的不同,同时也不能反映初级学习器的实际预测情况,针对此问题,基于熵值法改进Stacking算法进行文本的情感分类。首先,...  相似文献   

11.
基于模糊熵的支撑矢量预选取方法   总被引:1,自引:0,他引:1  
在基于支撑矢量机的分类器学习算法中,预先选择支撑矢量是非常重要的.依据模糊熵理论,提出一种启发式的支撑矢量预选取方法——模糊熵方法.该方法针对支撑矢量数目较小的情况,可以有效地预选取出包含支撑矢量的边界集.利用边界集作为训练集可以大大简化支撑矢量机的训练而不影响分类性能.与其它方法相比,该方法的主要优点是不需要参数来确定边界集的阈值.仿真实验结果表明该方法是有效和可行的.  相似文献   

12.
针对传统检测模型仅通过单一方法进行窃电检测具有局限性且用电数据中存在类不平衡的问题,从集成学习的角度出发,本文提出一种基于熵权法融合异质分类器的窃电检测模型。首先,通过少数类样本合成过采样技术(synthetic minority oversampling technique,SMOTE)处理用电数据不平衡的问题,其次综合考虑个体分类器之间的多样性以及各自的检测性能和训练机理进行基分类器的优选,最后,引入信息熵的概念,基于各个基分类器分类结果的分散程度,计算其权重占比,并以该权重占比集成各基分类器的输出。实验结果表明,对比传统的窃电检测模型,本文所提模型在多项评价指标下表现较好,具有良好的检测性能。  相似文献   

13.
支持向量机在处理分类问题时,如果两类数据重叠严重会造成分类器过学习,降低泛化性能。为此提出了一种基于信息熵的数据修剪支持向量机EB-SVM(entropy based-support vector machine),其主要思想是通过计算样例信息熵删除部分边缘数据和边界处混淆程度较高的样例以及噪声数据,用较少的训练样例学习SVM分类器。实验结果表明,该方法能够有效提高SVM的泛化性能。  相似文献   

14.
提出一种新的基于半监督的SVM-KNN分类方法,当可用的训练样本较少时,使用SVM进行分类,不能得到准确的分类边界,本文采用半监督学习策略从大量未标记样本中提取边界向量来改善SVM.KNN分类器的引进不仅扩充了SVM的训练样本数目,而且优化了迭代过程中训练样本的标记质量,可不断修复SVM的分类边界.实验结果表明,所提出的方法能提高SVM算法的分类精度,通过调整参数能够获得更好的分类效果,同时也减小了标记大量未标记样本的代价.  相似文献   

15.
图像灰度熵特征与SVM分类结合的人脸检测   总被引:2,自引:0,他引:2  
提出了一种基于支持向量机并综合图像灰度值和灰度熵的人脸检测方法.在信息论的编码熵的基础上提出了灰度熵的概念,并把人脸图像的行像素灰度熵和列像素灰度熵作为人脸图像的部分特征.在人脸检测系统中,把人脸图像的灰度值和行像素灰度熵和列像素灰度熵作为特征用支持向量机进行训练,得到检测用分类模型,然后把分类模型应用于人脸检测.实验证明了这种方法的有效性。  相似文献   

16.
集成学习通过将若干弱分类器集成以取得比单个弱分类器更好的性能,是机器学习的重要研究方向。针对常用城市地理模拟系统中元胞自动机转换规则获取算法的局限性,本文提出基于集成学习算法的元胞自动机,并将其应用于城市建设用地的动态模拟。以决策树作为弱分类器,应用集成学习算法和元胞自动机,对东莞市2001年到2005年的建设用地时空格局进行了模拟,取得了较好的模拟效果。精度评估结果表明,经集成学习后的决策树比单个决策树对城市建设用地动态的模拟精度更高,算法泛化能力更好。  相似文献   

17.
在汽轮机轴系振动故障模拟试验的基础上,对大量故障模拟试验数据进行计算,建立了典型故障的4种信息熵样本.采用概率神经网络对故障信号的4种信息熵特征进行融合研究,并将融合结果与最小距离分类器的分类效果进行了对照分析.研究表明,概率神经网络可实现对训练样本100%的正确识别率,对"陌生"样本的正确识别率也超过80%,其识别效果远远超过最小距离分类器.可见,概率神经网络综合了贝叶斯分类器和神经网络的优势,在汽轮机故障模式分类方面具有明显的优势,利用概率神经网络融合信号的信息熵特征实现汽轮机轴系故障模式识别是一种可行有效的方法.  相似文献   

18.
模糊算子函数丢失信息量过大,并且在某些点不存在导数,由此导致在采用传统的误差平方和准则优化网络参数时,有些参数无法得到调整,而且网络容易陷入局部极小,甚至发散.本文提出了一种基于模糊熵准则和误差平方和准则的多准则多层模糊神经网络学习算法,在一定程度上克服了单准则学习算法的局限性.  相似文献   

19.
半监督学习是一种利用有标记样本和无标记样本进行学习的新的机器学习方法。针对单分类中只有目标类标记样本和大量无标记样本的情况,提出了一种基于半监督学习的单类分类算法。利用已标识的有标记样本建立两个单类分类器,通过相互学习来挖掘未标记样本中的隐含信息,扩大有标记样本的数量。利用所有已标识样本,用不同的单分类方法建立多个单类分类器,通过集成学习的方法得到最终的分类器。在UCI数据集上进行了实验,表明提出的基于半监督学习的单类分类器的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号