摘 要: | 核岭回归(KRR)是一种重要的回归算法,具有可解释性、强泛化性能等优点,被广泛应用于模式识别、数据挖掘等领域;然而面对大规模数据时,核岭回归存在着训练效率较低的缺陷.为此,利用分而治之思想提出一种基于数据划分的核岭回归加速算法(PP-KRR).首先利用一簇平行超平面将当前数据所在的空间划分为m个互不相交的区域;其次在划分后的每个区域上训练KRR模型;最后每个KRR模型预测处在同一区域内的未标记实例.在真实数据集上与传统的算法进行实验比较分析,实验结果表明,提出的算法在保持一定预测精度的同时,能够获得更短的训练时间.
|