排序方式: 共有1条查询结果,搜索用时 78 毫秒
1
1.
电液伺服系统动态性能复杂多变,很难为其运动控制获得精确的动力学模型.本文以高精度电液伺服仿真模型作为研究对象,将电液伺服系统位置控制问题转化为强化学习中的状态稀疏奖励问题,使用基于强化学习的屏障函数安全控制方法进行控制器整定.相比传统控制方法,本文直接通过优化状态空间稀疏奖励与安全屏障辅助奖励实现基于数据的安全强化学习... 相似文献
1