首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
评价准则对分类器的构建起着重要作用, 在不平衡数据学习(IDL)中这更是如此. 众多研究已表明, 绝大部分传统的以精度准则为优化目标而获得的分类器是不适于IDL的. 那么其他准则又如何呢? 本文致力于回答这个问题. 通过在支持向量机(SVM)模型上进行“元学习”(Meta-Learning), 我们研究了若干常用的评价准则对IDL的影响, 这些准则包括ACC(精度)、BAC(平衡精度)、 GMean(几何平均)、F1(F1得分)、 IG(信息增益)、AUC(ROC曲线下方图面积)以及本文提出的两个新准则GAF和GBF. 在16个来自UCI的不平衡数据集上进行了仿真实验; 对实验结果的统计分析表明, 不同的准则对分类器性能的影响有显著差异. 即便是对于先进的学习方法SVM而言, 若以精度准则最大化选择分类器, 那么得到的SVM分类器也容易偏向预测多类(majority class). 然而, 通过在其他准则上优化, 我们能输出纠偏了的SVM分类器, 它们的整体性能更高, 尤其是在预测少类(minor class)能力方面得到了显著提高. 进一步地, 仿真实验发现在GAF以及GBF准则上优化所得的SVM分类器具有稳定且良好的性能, 这表明它们是值得采用的评价准则.  相似文献   

2.
提出一种基于数据关系(Data Relationship,DR)的多分类支持向量机(Support Vector Machine,SVM)学习算法(Multi-Classification SVM Algorithm Based on Data Relationship,DR-SVM).DR-SVM算法根据每类数据的关系(如向量积等)获取子学习嚣的冗余信息,从而优化多分类器组,然后通过经典的SVM算法训练分类器组.算法在简化分类器组的同时可对多类数据分类问题获得满意的泛化能力,在标准数据集上的实验结果表明,与经典的SVM多分类方法相比,DR-SVM具有更好的泛化性能,尤其对单个类别精度要求较高的数据尤其有效.  相似文献   

3.
支持向量机在处理分类问题时,如果两类数据重叠严重会造成分类器过学习,降低泛化性能。为此提出了一种基于信息熵的数据修剪支持向量机EB-SVM(entropy based-support vector machine),其主要思想是通过计算样例信息熵删除部分边缘数据和边界处混淆程度较高的样例以及噪声数据,用较少的训练样例学习SVM分类器。实验结果表明,该方法能够有效提高SVM的泛化性能。  相似文献   

4.
针对不平衡数据集数据分布不均匀及边界模糊的特点,提出一种新的近邻密度SVM(NNDSVM)不平衡数据集分类算法。该算法先计算多数类中每个样本K近邻范围内的密度值,依据该密度值分别选出边界区域、靠近边界区域的与少数类数目相等的样本与少数类完成SVM初始分类;用所得的支持向量机和剩余的多数类样本对初始分类器迭代优化。人工数据集和UCI数据集的实验结果表明,与SVM、ALSMOTE-SVM和WSVM算法相比,本文算法分类效果良好,能有效改进SVM算法在分布不均匀及边界模糊数据集上的分类性能。  相似文献   

5.
支持向量机( SVM: Support Vector Machine) 是定义在特征空间上的间隔最大的线性分类器,参数的选择 决定了其学习性能和泛化能力。针对此参数选择问题,采用改进的涡流搜索算法对支持向量机参数进行选择, 寻找最优适应度函数。仿真实验表明,改进的涡流搜索算法是一种有效的SVM 参数选择方法,有利于跳出局 部最小值,其优化性能不低于涡流搜索算法。  相似文献   

6.
针对支持向量机(SVM)分类器的模型选择问题,提出了一种基于特征空间的类别可分性度量(FCSM)准则,并将该准则用于优化多个高斯函数的线性组合系数.与核矩阵度量(FSM)准则相比,FCSM准则在核函数优化应用中的适用性更广,并且在优化效果上有更好的理论支持.实验结果表明,与交叉验证法、半径间隔误差(RM)界法以及基于FSM准则的优化方法相比,FCSM准则能从更大函数集范围优选出核函数,使SVM分类器获得更好的分类能力.  相似文献   

7.
针对不平衡数据集数据分布不均匀及边界模糊的特点,提出基于局部密度改进的SVM不平衡数据集分类算法.该算法先将多数类划分成多个子类,并依据子类内每个样本的局部密度选出边界区域、靠近边界区域的与少数类数目相等的样本,与少数类完成SVM初始分类;用所得的支持向量机和剩余的多数类样本对初始分类器进行迭代优化.结果表明,与WSVM,ALSMOTE-SVM和基本SVM算法相比,该算法分类效果良好,能有效改进SVM算法在分布不均匀及边界模糊数据集上的分类性能.  相似文献   

8.
针对不平衡数据集数据分布不均匀及边界模糊的特点,提出基于局部密度改进的SVM(NLDSVM)不平衡数据集分类算法。该算法先用层次k近邻法计算多数类中每个样本的局部密度,依据每个样本的局部密度值分别选出边界区域、靠近边界区域的与少数类数目相等的样本与少数类完成SVM初始分类;用所得的支持向量机和剩余的多数类样本对初始分类器迭代优化。人工数据集和UCI数据集的实验结果表明,与WSVM,ALSMOTE-SVM和基本SVM算法相比,NLDSVM算法G-mean的平均值提高了7%,F-measure的平均值提高了6%,AUC的平均值提高了6%。NLDSVM算法分类效果良好,能有效改进SVM算法在分布不均匀及边界模糊数据集上的分类性能。  相似文献   

9.
支持向量机(SVM)具有优良的学习能力和推广能力,然而其性能依赖于参数的选取.本文对影响模型分类能力的相关参数(C、σ2)进行了研究,提出了一种基于基因表达式编程(Gene Expression Programming,GEP)的支持向量机参数选择算法,即根据参数在分类器中的作用,利用GEP优化参数的两种编码方案分别对C与σ2进行编码,期望改进支持向量机的分类精度和泛化能力.最后实验表明了本文算法的有效性.  相似文献   

10.
基于蚁群优化支持向量机模型的公路客运量预测   总被引:2,自引:0,他引:2  
针对公路客运量预测难以建立精确预测模型的问题,文章引入基于蚁群优化的支持向量机算法对公路客运量进行预测。由于支持向量机的预测精度很大程度上取决于参数的选取,因此利用蚁群算法来优化其训练参数的选择,以得到优化的支持向量机预测模型,利用其对小样本及非线性数据优越的预测性能进行公路客运量的预测。以北京市的数据作为应用算例,并与BP神经网络及传统SVM的预测结果进行对比分析。实验结果表明,基于蚁群的支持向量机模型的预测精度更高,误差更小,可以更有效地对公路客运量进行预测;也说明利用蚁群算法进行支持向量机参数优选的方法是可行有效的。  相似文献   

11.
In this paper, the holomorphic sectional curvature under invariant metric on a Cartan-Hartogs domain of the second type YII(N,p,K) is presented and an invariant K?]lher metric which is complete and not less than the Bergman metric is constructed, such that its holomorphic sectional curvature is bounded above by a negative constant. Hence a comparison theorem for the Bergman and Kobayashi metrics on YII(N,p,K) is obtained.  相似文献   

12.
研究了近似指数度量并得到二阶近似指数度量射影平坦的充要条件是α射影平坦, β关于α平行.且对高阶指数度量也得到了相同的结果.这里,√αijy^iy^j,β=biy^i.  相似文献   

13.
在同一度量空间中可诱导出相容的两个不同度量会给人们处理问题带来方便,因此,度量的等价性是一个值得讨论的课题。首先,介绍了度量空间中的等价度量、度量拓扑、等价拓扑基及同胚映射等基本概念。然后,在此基础上讨论了等价度量的基本性质及各种概念间的内在联系,并由此给出了关于等价度量的判定性定理及其重要推论,给出了等价度量应用的简单实例。最后,通过构造的方式,给出了一种重要的等价度量形式。  相似文献   

14.
找到了一些方程去刻画局部对偶平坦的Matsumoto度量F=α2/α-β,其中α=√aijyiyj,β=biyi.同时对局部对偶平坦且具有迷向S-曲率的Matsumoto度量进行了分类.  相似文献   

15.
研究了具有标量旗曲率的R-齐次芬斯勒度量,证明了具有非零标量旗曲率的R-齐次芬斯勒度量必然是黎曼度量.  相似文献   

16.
考虑反正切Finsler度量F=α+εβ+βarctan(β/α)和Kropina度量F=α2/β的射影等价,其中:α和α为流形M的Riemann度量;β和β为流形M非零的1-形式.利用射影等价具有相同Douglas曲率的性质,得到了这两个度量射影等价的充要条件.  相似文献   

17.
找到了一组方程去刻画(α,β)-度量F=α+εβ+β2/α(ε为常数)与Randers度量F=α+β之间的射影等价,其中α和α是两个黎曼度量,β和β为流形上的两个非零的1-形式.  相似文献   

18.
本文以具有代表性的McCabe,Prather和Z-W三种方法为例,计算和分析了循环语句中for-do结构的程序复杂度,并纠正了关于Z-W表达式方法中不严格的计算公式.  相似文献   

19.
Fisher B证明了如下的不动点定理:设( X,d) 和( Y,ρ) 是完备的度量空间,T是X到Y的连续映射,S是Y到X的映射,并满足下列不等式,即对所有x,x′∈X,y,y′∈Y,0 ≤C≤1。d(STx,STx′) ≤Cmax{d(x,x′) ,d(x,STx),d(x′,STx′),ρ( Tx,Tx′)},ρ(TSy,TSy′) ≤Cmax{ρ(y,y′),ρ(y,TSy),ρ(y′,TSy′),d(Sy,Sy′)},则ST在X中有唯一不动点z,TS在Y中有唯一不动点w 。并且有Tz = w 和Sw = z。该文对此定理作一推广,从而得到了完备度量空间与紧度量空间上2 个新的不动点定理。  相似文献   

20.
研究了一类特殊的(α,β)度量,即指数度量F=αekβα.给出了指数度量的几个重要几何量.找到了其成为Berwald度量、Douglas度量、射影平坦的条件.最后还得到了计算(α,β)度量Douglas曲率的一个计算公式.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号