首页 | 本学科首页   官方微博 | 高级检索  
     检索      

融合KCCA推断强化学习的机器人智能轨迹规划
引用本文:傅剑,滕翔,曹策,娄平.融合KCCA推断强化学习的机器人智能轨迹规划[J].华中科技大学学报(自然科学版),2019,47(11):96-102.
作者姓名:傅剑  滕翔  曹策  娄平
作者单位:武汉理工大学 自动化学院,湖北武汉,430070;武汉理工大学 信息学院,湖北武汉,430070
基金项目:国家自然科学基金;国家自然科学基金;武汉理工大学优秀硕士论文培育项目
摘    要:针对当前模仿强化学习(LfDRL)框架面向新任务时并未考虑机器人各关节之间的联系,从而影响学习效果的不足,利用伪协方差矩阵的思想,基于再生核空间(RKHS)和广义瑞丽熵构建面向泛函指标的关节间摄动相关局部坐标系,进而设计出一种集成核典型相关分析(KCCA)与路径积分策略提升(PI~2)的强化学习方法.利用学习经验数据基于KCCA推断出机器人各关节间面向轨迹规划任务的隐含非线性启发式信息,引导PI~2搜索到最优/次优策略,使得机器人实现从示范轨迹规划任务到新轨迹规划任务的快速迁移学习,并高质量完成.选择顺应性装配机械手臂(SCARA)和优傲5(UR5)机器人的过单点、过两点迁移学习智能轨迹规划实验,结果表明:融合KCCA推断启发式信息的强化学习的平均代价下降率明显优于经典的PI~2算法,其机器人智能轨迹规划在提升学习收敛速度的同时也提高了机器人完成新任务的精度.

关 键 词:轨迹规划  模仿强化学习(LfDRL)  核典型相关分析(KCCA)  路径积分策略提升(PI2)  伪协方差矩阵

Intelligent trajectory planning based on reinforcement learning with KCCA inference for robot
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号