一种电液伺服系统安全强化学习控制方法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

一种电液伺服系统安全强化学习控制方法

引用本文：	唐逸凡,余臻,刘利军.一种电液伺服系统安全强化学习控制方法[J].厦门大学学报(自然科学版),2022(2):239-245.

作者姓名：	唐逸凡余臻刘利军

作者单位：	1. 厦门大学航空航天学院;2. 厦门大学深圳研究院

基金项目：	国家自然科学基金(61304110)；;福建省自然科学基金(2020J01052)；

摘要：	电液伺服系统动态性能复杂多变，很难为其运动控制获得精确的动力学模型.本文以高精度电液伺服仿真模型作为研究对象，将电液伺服系统位置控制问题转化为强化学习中的状态稀疏奖励问题，使用基于强化学习的屏障函数安全控制方法进行控制器整定.相比传统控制方法，本文直接通过优化状态空间稀疏奖励与安全屏障辅助奖励实现基于数据的安全强化学习控制器整定，其预设安全性为强化学习控制方法实际应用于工业生产奠定了基础.结果表明，使用安全屏障辅助奖励项进行稀疏奖励优化保障算法收敛性的同时能有效实现稳态安全控制目标.在高精度电液伺服系统非线性多项式仿真模型的位置控制问题中证明了本文所提安全强化学习控制方法的有效性.
关键词：	电液伺服系统安全控制强化学习屏障函数