数据挖掘中的属性选择偏差抑制算法研究简 |
| |
引用本文: | 潘大胜, 屈迟文, 吴再群,.数据挖掘中的属性选择偏差抑制算法研究简[J].西南师范大学学报(自然科学版),2016,41(11):160-164. |
| |
作者姓名: | 潘大胜 屈迟文 吴再群 |
| |
作者单位: | 百色学院信息工程学院; |
| |
摘 要: | 决策树算法广泛应用于数据挖掘领域之中.属性选择是决策树方法挖掘效率的关键,但ID3方法和C4.5方法在选择属性时,都会产生一定程度的选择偏差.据此,该文对信息增益模型进行了改进,将多次对数运算的信息熵求取过程简化为多值求和,从而规避了属性选择出现偏差的可能性,也加快了决策树构建的执行速度.依托学生情况数据展开的实验研究表明,与经典的ID3方法相比,该文方法构建的决策树更加简洁.同时,随着数据样本数量的增大,该文方法的执行时间大为降低.
|
关 键 词: | 数据挖掘 决策树 属性选择 偏差抑制 |
|
| 点击此处可从《西南师范大学学报(自然科学版)》浏览原始摘要信息 |
| 点击此处可从《西南师范大学学报(自然科学版)》下载免费的PDF全文 |
|