一种针对类别不平衡的代价敏感集成算法 |
| |
作者姓名: | 谭浩 田爱奎 吴志勇 |
| |
作者单位: | 山东理工大学计算机科学与技术学院 |
| |
摘 要: | 现实世界中的数据挖掘经常涉及从类别分布不平衡的数据集学习,少数类的数量相比于其他类较少.从包含少数类的数据集中学习,通常会产生偏向于多数类的预测分类器,但对少数类的预测精度较差.针对少数类学习提出一种新的集成算法Cost-SMOTEBoost,该算法是SMOTE算法和AdaCost算法的结合.通过实验表明,Cost-SMOTEBoost算法在不降低精确率的情况下提高了召回率,从而提高了在分布不平衡数据集上的表现.
|
本文献已被 CNKI 等数据库收录! |
|