首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于MADDPG的多AGVs路径规划算法
引用本文:尹华一,尤雅丽,黄新栋,段青娜.基于MADDPG的多AGVs路径规划算法[J].厦门理工学院学报,2024(1):37-46.
作者姓名:尹华一  尤雅丽  黄新栋  段青娜
作者单位:1. 厦门理工学院计算机与信息工程学院;2. 厦门理工学院光电与通信工程学院;3. 红云红河烟草(集团)有限责任公司
基金项目:国家自然科学基金项目(61503316,62372392);;福建省自然科学基金项目(2021J011182,2021J011191,2022J011275);
摘    要:针对多辆自动导引车系统(automated guided vehicle system,AGVs)在动态不确定环境下完成货物运送并进行路径规划的问题,提出一种基于多智能体深度确定性策略梯度(MADDPG)的多AGVs路径规划算法。本方法通过状态空间、动作空间、奖励函数和网络结构重新设计MADDPG算法的模型结构,通过OpenAI Gym接口搭建二维仿真环境用作多AGVs (agents)的训练平台。实验结果表明,相比于深度确定性策略梯度(DDPG)算法和双延迟深度确定性策略梯度(TD3)算法,基于MADDPG的多AGVs路径规划算法在智能仓储仿真环境下,多AGVs碰到货架的次数分别减少了21.49%、11.63%,碰到障碍物的次数分别减少了14.69%、10.12%,全部AGVs到达货物装卸点的成功率分别高出了17.22%、10.53%,表明学习后的AGV具有更高效的在线决策能力和自适应能力,能够找到较优的路径。

关 键 词:自动导引车系统(AGVs)  路径规划  多智能体深度确定性策略梯度(MADDPG)算法  深度强化学习  多智能体
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号