一种电液伺服系统安全强化学习控制方法 |
| |
引用本文: | 唐逸凡,余臻,刘利军.一种电液伺服系统安全强化学习控制方法[J].厦门大学学报(自然科学版),2022(2):239-245. |
| |
作者姓名: | 唐逸凡 余臻 刘利军 |
| |
作者单位: | 1. 厦门大学航空航天学院;2. 厦门大学深圳研究院 |
| |
基金项目: | 国家自然科学基金(61304110);;福建省自然科学基金(2020J01052); |
| |
摘 要: | 电液伺服系统动态性能复杂多变,很难为其运动控制获得精确的动力学模型.本文以高精度电液伺服仿真模型作为研究对象,将电液伺服系统位置控制问题转化为强化学习中的状态稀疏奖励问题,使用基于强化学习的屏障函数安全控制方法进行控制器整定.相比传统控制方法,本文直接通过优化状态空间稀疏奖励与安全屏障辅助奖励实现基于数据的安全强化学习...
|
关 键 词: | 电液伺服系统 安全控制 强化学习 屏障函数 |
|
|