摘 要: | 随着机械装备发展的日益大型化和复杂化,其使用安全性和可靠性也越来越受到重视.剩余使用寿命(remaining useful life, RUL)预测技术,通过分析设备的运行数据,预测设备还能正常运行的时间,利用该技术可有效提升设备运行的安全性和可靠性,同时可为设备的后续维修决策提供关键依据.本文提出一种基于深度强化学习(deep reinforcement learning, DRL)的RUL预测方法,首先通过自编码器(autoencoder, AE)对机械装备的原始信号进行特征提取,利用提取到的特征构成强化学习的状态变量,通过设置合适的动作空间和奖励函数训练强化学习模型,使其能依据样本间的时序相关性对装备的RUL进行准确预测.与其他方法相比,强化学习方法的时序交互决策逻辑可以自然地保留样本间的时序依赖关系,降低了RUL预测的波动性.最后利用涡轮发动机数据集CMPASS对提出的方法进行实验验证,所提出的方法在RMSE和Score两项指标上均优于目前多种RUL预测方法,且所提出方法对于接近退化末期的装备预测效果有明显提升.
|