基于策略迭代的离散多智能体系统最优一致性控制研究 |
| |
作者姓名: | 黄垲亮 王莉 |
| |
作者单位: | 天津理工大学计算科学与工程学院 |
| |
基金项目: | 国家自然科学基金(61403280,61773286); |
| |
摘 要: | 对于未知动力学的离散多智能体系统最优一致性控制问题,提出一种新颖的策略迭代算法,采用(hamilton-jacobi-bellman, HJB)方程解决多智能体系统的最优一致性控制问题。在实际应用中,由于多智能体系统具有复杂性和未知性,使完整的动力学模型无法获取,用一般的数学方法无法得到HJB方程的解。为克服这些困难,新方法借助强化学习,只需智能体与邻居间的状态信息误差,即可近似得到最优的控制策略,并给出策略迭代算法的收敛性证明,理论上证明了可解决未知多智能体系统的最优一致性控制问题。通过仿真试验证明:文中算法比传统的策略迭代算法更具有高效性。
|
关 键 词: | 多智能体系统 最优一致性控制 策略迭代 强化学习 |
|
|