基于随机森林的数据分类应用研究 |
| |
作者单位: | ;1.长治学院计算机系;2.昆士兰科技大学数学科学学院 |
| |
摘 要: | 机器学习在近几年得到了迅猛的发展,其中随机森林(Random Forest)在决策树的基础上演变出来的一种机器学习方法,利用其可以进行数据建模,分类,预测等。探索了随机森林算法在数据预测上的应用,基于一个泰坦尼克乘客数据集,预测泰坦尼克号乘客的命运(是否生存)。此数据集包含了将近80%乘客的信息和生存状态,包含1 309个样本,每个样本包含14个属性。实验验证了随机森林算法在受试者工作特征曲线等方面表现较好,具有一定的参考性和可拓展性。
|
关 键 词: | 机器学习 随机森林 受试者工作特征曲线 |
Application of Data Classification Based on Random Forest |
| |
Abstract: |
|
| |
Keywords: | |
|
|