基于MADDPG的多AGVs路径规划算法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于MADDPG的多AGVs路径规划算法

引用本文：	尹华一,尤雅丽,黄新栋,段青娜.基于MADDPG的多AGVs路径规划算法[J].厦门理工学院学报,2024(1):37-46.

作者姓名：	尹华一尤雅丽黄新栋段青娜

作者单位：	1. 厦门理工学院计算机与信息工程学院;2. 厦门理工学院光电与通信工程学院;3. 红云红河烟草(集团)有限责任公司

基金项目：	国家自然科学基金项目（61503316,62372392）；;福建省自然科学基金项目（2021J011182,2021J011191,2022J011275）；

摘要：	针对多辆自动导引车系统（automated guided vehicle system,AGVs）在动态不确定环境下完成货物运送并进行路径规划的问题，提出一种基于多智能体深度确定性策略梯度（MADDPG）的多AGVs路径规划算法。本方法通过状态空间、动作空间、奖励函数和网络结构重新设计MADDPG算法的模型结构，通过OpenAI Gym接口搭建二维仿真环境用作多AGVs (agents)的训练平台。实验结果表明，相比于深度确定性策略梯度（DDPG）算法和双延迟深度确定性策略梯度（TD3）算法，基于MADDPG的多AGVs路径规划算法在智能仓储仿真环境下，多AGVs碰到货架的次数分别减少了21.49%、11.63%，碰到障碍物的次数分别减少了14.69%、10.12%，全部AGVs到达货物装卸点的成功率分别高出了17.22%、10.53%，表明学习后的AGV具有更高效的在线决策能力和自适应能力，能够找到较优的路径。
关键词：	自动导引车系统(AGVs) 路径规划多智能体深度确定性策略梯度(MADDPG)算法深度强化学习多智能体

设为首页 | 免责声明 | 关于勤云 | 加入收藏