基于主成分分析法的两步子抽样算法及应用研究 |
| |
引用本文: | 王玉,李莉莉,周楷贺.基于主成分分析法的两步子抽样算法及应用研究[J].青岛大学学报(自然科学版),2023(4):13-17. |
| |
作者姓名: | 王玉 李莉莉 周楷贺 |
| |
作者单位: | 青岛大学经济学院 |
| |
基金项目: | 国家社科基金(批准号:2019BTJ028)资助; |
| |
摘 要: | 针对大数据中高维变量多重共线性问题,结合Logistic模型提出两种基于主成分分析法的两步子抽样算法,分别为基于A-最优准则的最小均方误差(minimum Mean Square Error, mMSE)抽样和基于L-最优准则的最小方差协方差(minimum Variance covariance, mVc)抽样。实证结果表明,相较于随机抽样,mMSE抽样和mVc抽样能大幅降低模型参数估计的均方误差,提升模型的查准率、召回率、F1分数、特异度等分类评价指标。
|
关 键 词: | 大数据 主成分分析法 两步子抽样算法 信用风险预测 |
|
|