基于代价敏感的随机森林不平衡数据分类算法 |
| |
引用本文: | 杨杰明,高聪,曲朝阳,阚中锋,高冶,常成.基于代价敏感的随机森林不平衡数据分类算法[J].科学技术与工程,2018(6). |
| |
作者姓名: | 杨杰明 高聪 曲朝阳 阚中锋 高冶 常成 |
| |
作者单位: | 东北电力大学信息工程学院;国网吉林供电公司 |
| |
摘 要: | 随机森林在分类不平衡数据时,容易偏向多数类而忽略少数类。可以将代价敏感用于分类器的训练;但在传统代价敏感随机森林算法中,代价函数没有考虑样本集实际分布与特征权重,且在随机森林投票阶段,没有考虑基分类器的性能差异。提出一种改进的代价敏感随机森林算法ICSRF,该算法首先根据不平衡数据集的实际分布构造代价函数;并将权重距离引入代价函数,然后根据基分类器的性能采取权重投票,提高分类准确率。实验结果表明,ICSRF算法能有效提高少数类的分类性能,可以较好地处理不平衡数据。
|
本文献已被 CNKI 等数据库收录! |
|