一种新的近邻密度SVM不平衡数据集分类算法 |
| |
引用本文: | 刘悦婷,孙伟刚,张发菊.一种新的近邻密度SVM不平衡数据集分类算法[J].贵州大学学报(自然科学版),2019,36(3). |
| |
作者姓名: | 刘悦婷 孙伟刚 张发菊 |
| |
作者单位: | 兰州文理学院 传媒工程学院,甘肃 兰州,730000;兰州文理学院 传媒工程学院,甘肃 兰州,730000;兰州文理学院 传媒工程学院,甘肃 兰州,730000 |
| |
基金项目: | 2017年兰州文理学院校级种子基金(自然)项目资助;2015年甘肃省高等学校科研项目资助 |
| |
摘 要: | 针对不平衡数据集数据分布不均匀及边界模糊的特点,提出一种新的近邻密度SVM(NNDSVM)不平衡数据集分类算法。该算法先计算多数类中每个样本K近邻范围内的密度值,依据该密度值分别选出边界区域、靠近边界区域的与少数类数目相等的样本与少数类完成SVM初始分类;用所得的支持向量机和剩余的多数类样本对初始分类器迭代优化。人工数据集和UCI数据集的实验结果表明,与SVM、ALSMOTE-SVM和WSVM算法相比,本文算法分类效果良好,能有效改进SVM算法在分布不均匀及边界模糊数据集上的分类性能。
|
关 键 词: | 支持向量机 不平衡数据集 近邻密度 分布不均匀 边界区域 |
本文献已被 CNKI 万方数据 等数据库收录! |
|