基于多智能体强化学习的协同目标分配 |
| |
引用本文: | 马悦,吴琳,许霄.基于多智能体强化学习的协同目标分配[J].系统工程与电子技术,2023(9):2793-2801. |
| |
作者姓名: | 马悦 吴琳 许霄 |
| |
作者单位: | 1. 国防大学研究生院;2. 中国人民解放军31002部队;3. 国防大学联合作战学院 |
| |
摘 要: | 针对传统方法难以适用于动态不确定环境下的大规模协同目标分配问题,提出一种基于多智能体强化学习的协同目标分配模型及训练方法。通过对相关概念和数学模型的描述,将协同目标分配转化为多智能体协作问题。聚焦于顶层分配策略的学习,构建了策略评分模型和策略推理模型,采用Advantage Actor-Critic算法进行策略优化。仿真实验结果表明,所提方法能够准确刻画作战单元之间的协同演化内因,有效地实现了大规模协同目标分配方案的动态生成。
|
关 键 词: | 协同目标分配 多智能体协作 强化学习 神经网络 Advantage Actor-Critic |
|
|