基于自适应采样的不平衡分类方法 |
| |
引用本文: | 陈琼,谢家亮.基于自适应采样的不平衡分类方法[J].华南理工大学学报(自然科学版),2022(4):26-34+45. |
| |
作者姓名: | 陈琼 谢家亮 |
| |
作者单位: | 华南理工大学计算机科学与工程学院 |
| |
基金项目: | 国家自然科学基金资助项目(62176095); |
| |
摘 要: | 针对传统重采样方法大多使用固定采样策略,无法根据模型的优化需求改变采样策略的问题,提出一种基于自适应采样的不平衡分类方法(ASIC)。该方法根据分类模型在验证集上的表现动态调整训练集上不同类别样本的采样概率,使不同类别的采样概率由当前分类模型的需求动态决定;同时,该方法对少数类给予额外的关注,在其余条件相同的情况下为少数类赋予更大的采样概率,以弥补少数类本身样本数量不足对分类模型造成的不良影响,从而提高分类模型对少数类的识别能力。实验结果表明,使用ASIC方法训练的分类模型的平均类准确率和召回率的几何平均值均比对比方法更好,且数据分布越不平衡,ASIC方法的优势越明显。
|
关 键 词: | 不平衡分类 自适应采样 召回率 |
|
|