首页 | 本学科首页   官方微博 | 高级检索  
     

基于策略迭代的离散多智能体系统最优一致性控制研究
作者姓名:黄垲亮  王莉
作者单位:天津理工大学计算科学与工程学院
基金项目:国家自然科学基金(61403280,61773286);
摘    要:对于未知动力学的离散多智能体系统最优一致性控制问题,提出一种新颖的策略迭代算法,采用(hamilton-jacobi-bellman, HJB)方程解决多智能体系统的最优一致性控制问题。在实际应用中,由于多智能体系统具有复杂性和未知性,使完整的动力学模型无法获取,用一般的数学方法无法得到HJB方程的解。为克服这些困难,新方法借助强化学习,只需智能体与邻居间的状态信息误差,即可近似得到最优的控制策略,并给出策略迭代算法的收敛性证明,理论上证明了可解决未知多智能体系统的最优一致性控制问题。通过仿真试验证明:文中算法比传统的策略迭代算法更具有高效性。

关 键 词:多智能体系统  最优一致性控制  策略迭代  强化学习
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号