首页 | 本学科首页   官方微博 | 高级检索  
     检索      

高维数据情形下的一种基于随机投影的集成分类方法
摘    要:针对高维数据的分类问题,提出一种基于随机投影的决策树集成学习方法(Projection Forest,简记PJForest).该方法以决策树为基分类器,利用一系列随机投影对数据进行降维,基于降维后的数据构建相应的一系列决策树,而后通过集成学习构造集成分类器.利用适当的随机投影对数据进行降维,能保持数据几何结构的信息;且通过随机投影对原始数据进行扰动,能丰富决策树的多样性,经过适当集成可有效克服噪音的影响,进而提升PJForest的泛化能力.证明了PJForest泛化误差的极限性质,得到泛化误差在一定意义下的收敛速度.还开展大量的模拟研究,并对实际数据进行了实证分析.模拟研究的结果表明,PJForest能有效地对包含大量噪音的高维数据进行分类,与已有的诸如随机森林、Xgboost这些方法相比,有更好的分类性能.

本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号