首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于改进DDPG算法的机器人路径规划算法研究
摘    要:为解决深度强化学习训练时间长、收敛慢的问题,该文针对未知环境下的机器人路径规划,基于深度确定性策略梯度(DDPG)算法,结合人工势场法设计了回报函数。为了符合机器人运动学模型,设计连续的状态和动作空间。采用Python语言,在不同地图下分别使用人工势场法、原始DDPG和该文改进的DDPG算法进行仿真对比实验。改进的DDPG算法通过结合人工势场法,在训练中能够给予模型一定的指引,减少训练的盲目性和随机性,从而大大缩短训练时间,更早得到优化模型。训练1000回合后,原始DDPG算法的成功率为70%,改进DDPG算法的成功率为92%。

本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号