首页 | 本学科首页   官方微博 | 高级检索  
     

基于改进DDPG算法的机器人路径规划算法研究
作者姓名:周盛世  单梁  常路  陈佳  刘成林  李军
作者单位:南京理工大学 自动化学院,江苏 南京210094;江南大学 轻工过程先进控制教育部重点实验室,江苏 无锡214122
基金项目:国家自然科学基金;中央高校基本科研业务费专项;江苏省自然科学基金
摘    要:为解决深度强化学习训练时间长、收敛慢的问题,该文针对未知环境下的机器人路径规划,基于深度确定性策略梯度(DDPG)算法,结合人工势场法设计了回报函数.为了符合机器人运动学模型,设计连续的状态和动作空间.采用Python语言,在不同地图下分别使用人工势场法、原始DDP G和该文改进的DDP G算法进行仿真对比实验.改进的...

关 键 词:深度确定性策略梯度  机器人  路径规划  未知环境  深度强化学习  人工势场法
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号