基于策略迭代的离散多智能体系统最优一致性控制研究期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于策略迭代的离散多智能体系统最优一致性控制研究

作者姓名：	黄垲亮王莉

作者单位：	天津理工大学计算科学与工程学院

基金项目：	国家自然科学基金(61403280,61773286);

摘要：	对于未知动力学的离散多智能体系统最优一致性控制问题,提出一种新颖的策略迭代算法,采用(hamilton-jacobi-bellman, HJB)方程解决多智能体系统的最优一致性控制问题。在实际应用中,由于多智能体系统具有复杂性和未知性,使完整的动力学模型无法获取,用一般的数学方法无法得到HJB方程的解。为克服这些困难,新方法借助强化学习,只需智能体与邻居间的状态信息误差,即可近似得到最优的控制策略,并给出策略迭代算法的收敛性证明,理论上证明了可解决未知多智能体系统的最优一致性控制问题。通过仿真试验证明：文中算法比传统的策略迭代算法更具有高效性。
关键词：	多智能体系统最优一致性控制策略迭代强化学习