基于Boosting算法的C5.0决策树不平衡数据分类算法 |
| |
引用本文: | 王植,张珏.基于Boosting算法的C5.0决策树不平衡数据分类算法[J].河南科学,2023(1):7-12. |
| |
作者姓名: | 王植 张珏 |
| |
作者单位: | 1. 西安航空职业技术学院;2. 榆林学院信息理工学院 |
| |
基金项目: | 陕西省科技计划一般项目(2020NY-163);;榆林市科技计划项目(CXY-2022-66); |
| |
摘 要: | 为了改进不平衡数据的分类性能,提出一种可自动确定迭代参数trail值的集成C5.0决策树算法.首先,算法引入boosting集成框架到C5.0决策树算法中,从而生成新的集成分类器;其次,算法使用网格搜索法在一定范围内自动确定trail参数的值.实验结果表明,该算法在不平衡数据上的分类性能指标G-mean和MCC上具有优势.
|
关 键 词: | 类不平衡问题 集成算法 C5.0决策树算法 网格搜索算法 |
|