首页 | 本学科首页   官方微博 | 高级检索  
     检索      

小样本不平衡设备数据下的机器学习策略研究
引用本文:陈扬,刘勤明,梁耀旭.小样本不平衡设备数据下的机器学习策略研究[J].上海理工大学学报,2022,44(4):407-416.
作者姓名:陈扬  刘勤明  梁耀旭
作者单位:上海理工大学 管理学院,上海 200093
基金项目:国家自然科学基金资助项目(71632008, 71840003);上海市自然科学基金资助项目(19ZR1435600); 教育部人文社会科学研究规划基金资助项目(20YJAZH068);上海理工大学科技发展项目(2020KJFZ038);2020年上海理工大学大学生创新创业训练计划项目(SH2020067)
摘    要:针对小样本数据样本容量不足与分布不平衡的设备寿命预测问题,构建基于改进SMOTE算法与改进KNN(K-NearestNeighbor)算法联合优化模型。首先,设置噪声比例系数β排除样本数据中的噪声,随后通过类B-SMOTE(Borderline-SMOTE)算法与传统SOMTE算法结合构建改进SMOTE(ISMOTE)算法对存在分布问题的少数类样本进行新增优化,避免因为样本分布不平衡以及样本数量较少引起的偏差。其次,针对分类过程中边界模糊的样本点,通过利用粒子群算法寻求每个样本种类中心点并计算样本距离均值建立分隔阈值$ \stackrel{-}{d} $,对阈值范围内的样本点利用“投票法”判断样本种类,规避KNN算法在处理数据时因为不同种类样本混合而出现误差的问题。最后,通过利用美国卡特彼勒公司液压泵状态数据以及凌津滩水电站水导轴承振动数据进行仿真,算例证明上述两种改进算法在面对小样本不平衡设备数据时可以准确分析设备运行状态以及预测设备未来健康发展趋势。

关 键 词:机器学习  寿命预测  小样本  KNN算法  SMOTE算法
收稿时间:2021/8/22 0:00:00

Machine learning strategy under small sample unbalanced equipment data
CHEN Yang,LIU Qinming,LIANG Yaoxu.Machine learning strategy under small sample unbalanced equipment data[J].Journal of University of Shanghai For Science and Technology,2022,44(4):407-416.
Authors:CHEN Yang  LIU Qinming  LIANG Yaoxu
Institution:Business School, University of Shanghai for Science & Technology, Shanghai 200093, China
Abstract:
Keywords:machine learning  life prediction  small sample  KNN algorithm  SMOTE algorithm
点击此处可从《上海理工大学学报》浏览原始摘要信息
点击此处可从《上海理工大学学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号