首页 | 本学科首页   官方微博 | 高级检索  
     

基于Leading-Club不平衡数据处理方法研究
作者姓名:张丹  曹国正  王效禹  程志远
摘    要:不平衡数据分类是数据分析和机器学习的重要研究对象.类内的、类间的分布不均以及稀有样本均会导致模型训练结果不理想.本文以Leading-Club不平衡数据为研究对象,提出了重新划分数据的方法.一是对样本进行有效缩减,通过聚类算法有效提取未违约数据的共性,结合欠采样方法,保留有效特征;二是平衡分类信息,考虑类内的不平衡分类...

关 键 词:数据分析  不平衡数据  不平衡分类  聚类算法  欠采样
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号