一种改进的代价敏感随机森林算法 |
| |
作者姓名: | 杨杰明 高聪 曲朝阳 阚中锋 高冶 常成 |
| |
作者单位: | 东北电力大学,东北电力大学信息工程学院,东北电力大学,国网吉林供电公司,国网吉林供电公司,国网吉林供电公司 |
| |
基金项目: | 国家自然科学基金项目(面上项目,重点项目,重大项目)吉林省科技计划项目 |
| |
摘 要: | 随机森林在分类不平衡数据时,容易偏向多数类而忽略少数类,可以将代价敏感用于分类器的训练,但在传统代价敏感随机森林算法中,代价函数没有考虑样本集实际分布与特征权重,且在随机森林投票阶段,没有考虑基分类器的性能差异。本文提出一种改进的代价敏感随机森林算法ICSRF,该算法首先根据不平衡数据集的实际分布构造代价函数,并将权重距离引入代价函数,然后根据基分类器的性能采取权重投票,提高分类准确率。实验结果表明,ICSRF算法能有效提高少数类的分类性能,可以较好的处理不平衡数据。
|
关 键 词: | 代价敏感 随机森林 不平衡数据 权重距离 |
收稿时间: | 2017-07-22 |
修稿时间: | 2017-09-19 |
|
| 点击此处可从《科学技术与工程》浏览原始摘要信息 |
|
点击此处可从《科学技术与工程》下载免费的PDF全文 |
|