三支过采样的不平衡数据分类方法 |
| |
引用本文: | 方宇,郑胡宇,曹雪梅.三支过采样的不平衡数据分类方法[J].山东大学学报(理学版),2023(12):41-51. |
| |
作者姓名: | 方宇 郑胡宇 曹雪梅 |
| |
作者单位: | 西南石油大学计算机科学学院 |
| |
基金项目: | 国家自然科学基金资助项目(62006200); |
| |
摘 要: | 结合三支决策和合成少数过采样技术(synthetic minority over-sampling technique, SMOTE),提出了一种新的采样方法—三支过采样(three-way over-sampling, 3WOS)。3WOS通过对所有样本构建三支决策模型,选取该模型边界域中的样本作为关键样本进行SMOTE过采样,从而有效缓解样本聚集和分离问题,在一定程度上提高了分类器性能。该方法首先在少数类样本上应用三支决策和支持向量数据描述,将所有样本数据进行三分;其次,找出所有关键样本的k个最近邻少数类样本,并使用线性插值方式对每个关键样本合成新样本,然后形成新的少数类样本;最后,将更新后的样本集用于训练分类器。实验结果表明,3WOS方法比其他方法在基分类器上有较好的分类准确度、F-measure、G-mean和较少的代价值。
|
关 键 词: | 不平衡数据 三支决策 支持向量数据描述 合成少数过采样技术 分类 |
|
|