决策树算法及其改进 |
| |
作者姓名: | 蔡星 |
| |
作者单位: | [1]湖南大学 [2]湖南第一师范学院,湖南长沙410205 |
| |
摘 要: | 该文对传统的C 4.5决策树数据挖掘算法进行了改进,提出了一种双重熵平均决策树算法。传统的C 4.5决策树算法易出现无意义分枝,过度拟合等问题,针对该类问题,基于双重熵平均决策树算法,通过两次对样本子集熵平均值的计算、排序、合并处理,得到修正后的属性信息增益,并以此作为属性选择的依据,从而解决了传统C 4.5决策树算法可解释性差、易产生碎片等问题。
|
关 键 词: | C 4 5决策树 算法 熵 平衡因子 |
本文献已被 维普 等数据库收录! |
|