面向多维特性数据的缺失值检测及填补方法对比 |
| |
作者姓名: | 乔非 翟晓东 王巧玲 |
| |
作者单位: | 同济大学 电子与信息工程学院,上海 201804 |
| |
基金项目: | 科技创新 2030“新一代人工智能”重大项目(2018AAA0101704);国家自然科学基金(62133011,61973237,61873191) |
| |
摘 要: |  针对传统缺失值检测方法缺少对多维特性数据全面立体的分析及难以从众多缺失值填补算法中选择合适方法的问题,通过设计缺失值检测方法,在目前常见的数据点缺失度基础上,首次提出数据总体缺失度和加权数据总体缺失度的概念,实现对数据集缺失程度的全面检测,进而通过实验对比分析不同缺失值填补方法性能。实验结果表明,在不同缺失度的情况下,不同缺失值填补算法的性能不同,所提出的方法可为缺失值填补算法的选择提供有效依据。

|
关 键 词: | 数据预处理 缺失值检测 缺失度 缺失值填补方法 |
收稿时间: | 2022-04-11 |
|
| 点击此处可从《同济大学学报(自然科学版)》浏览原始摘要信息 |
|
点击此处可从《同济大学学报(自然科学版)》下载免费的PDF全文 |
|