基于MADDPG的多AGVs路径规划算法 |
| |
引用本文: | 尹华一,尤雅丽,黄新栋,段青娜.基于MADDPG的多AGVs路径规划算法[J].厦门理工学院学报,2024(1):37-46. |
| |
作者姓名: | 尹华一 尤雅丽 黄新栋 段青娜 |
| |
作者单位: | 1. 厦门理工学院计算机与信息工程学院;2. 厦门理工学院光电与通信工程学院;3. 红云红河烟草(集团)有限责任公司 |
| |
基金项目: | 国家自然科学基金项目(61503316,62372392);;福建省自然科学基金项目(2021J011182,2021J011191,2022J011275); |
| |
摘 要: | 针对多辆自动导引车系统(automated guided vehicle system,AGVs)在动态不确定环境下完成货物运送并进行路径规划的问题,提出一种基于多智能体深度确定性策略梯度(MADDPG)的多AGVs路径规划算法。本方法通过状态空间、动作空间、奖励函数和网络结构重新设计MADDPG算法的模型结构,通过OpenAI Gym接口搭建二维仿真环境用作多AGVs (agents)的训练平台。实验结果表明,相比于深度确定性策略梯度(DDPG)算法和双延迟深度确定性策略梯度(TD3)算法,基于MADDPG的多AGVs路径规划算法在智能仓储仿真环境下,多AGVs碰到货架的次数分别减少了21.49%、11.63%,碰到障碍物的次数分别减少了14.69%、10.12%,全部AGVs到达货物装卸点的成功率分别高出了17.22%、10.53%,表明学习后的AGV具有更高效的在线决策能力和自适应能力,能够找到较优的路径。
|
关 键 词: | 自动导引车系统(AGVs) 路径规划 多智能体深度确定性策略梯度(MADDPG)算法 深度强化学习 多智能体 |
|
|