融合KCCA推断强化学习的机器人智能轨迹规划 Intelligent trajectory planning based on reinforcement learning with KCCA inference for robot期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

融合KCCA推断强化学习的机器人智能轨迹规划

引用本文：	傅剑,滕翔,曹策,娄平.融合KCCA推断强化学习的机器人智能轨迹规划[J].华中科技大学学报(自然科学版),2019,47(11):96-102.

作者姓名：	傅剑滕翔曹策娄平

作者单位：	武汉理工大学自动化学院,湖北武汉,430070;武汉理工大学信息学院,湖北武汉,430070

基金项目：	国家自然科学基金;国家自然科学基金;武汉理工大学优秀硕士论文培育项目

摘要：	针对当前模仿强化学习(LfDRL)框架面向新任务时并未考虑机器人各关节之间的联系,从而影响学习效果的不足,利用伪协方差矩阵的思想,基于再生核空间(RKHS)和广义瑞丽熵构建面向泛函指标的关节间摄动相关局部坐标系,进而设计出一种集成核典型相关分析(KCCA)与路径积分策略提升(PI~2)的强化学习方法.利用学习经验数据基于KCCA推断出机器人各关节间面向轨迹规划任务的隐含非线性启发式信息,引导PI~2搜索到最优/次优策略,使得机器人实现从示范轨迹规划任务到新轨迹规划任务的快速迁移学习,并高质量完成.选择顺应性装配机械手臂(SCARA)和优傲5(UR5)机器人的过单点、过两点迁移学习智能轨迹规划实验,结果表明:融合KCCA推断启发式信息的强化学习的平均代价下降率明显优于经典的PI~2算法,其机器人智能轨迹规划在提升学习收敛速度的同时也提高了机器人完成新任务的精度.
关键词：	轨迹规划模仿强化学习(LfDRL) 核典型相关分析(KCCA) 路径积分策略提升(PI2) 伪协方差矩阵
Intelligent trajectory planning based on reinforcement learning with KCCA inference for robot

Abstract:

Keywords:
本文献已被万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏