一种深度强化学习的机械臂控制方法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

一种深度强化学习的机械臂控制方法

作者单位：	河南科技大学机电工程学院,河南洛阳 471003;洛阳银杏科技有限公司,河南洛阳 471003

基金项目：	国家自然科学基金;河南省高等学校重点科研项目

摘要：	针对工业液压机械臂末端控制精度受惯性和摩擦等因素影响的问题,提出了一种基于深度强化学习的机械臂控制方法。首先,在机器人操作系统环境下搭建仿真机械臂并进行控制和通信模块设计。然后,对深度确定性策略梯度(DDPG)算法中的Actor-Critic网络进行设计,并基于机械臂逆运动学与深度强化学习奖励机制,设计了一种包含精度指标的分层奖励函数,促进DDPG算法收敛。最后,采用改进的DDPG算法与仿真机械臂交互训练,获得机械臂控制模型,从而实现对机械臂末端的精确控制。试验结果表明:改进的DDPG算法收敛速度提升了约14.54%,在仿真环境下机械臂可以达到6 mm的末端位置控制精度,多点测试完成率最高达到90%。
关键词：	机械臂深度强化学习 DDPG 控制精度
本文献已被 CNKI 万方数据等数据库收录！