基于改进SNN-HRL的智能体路径规划算法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于改进SNN-HRL的智能体路径规划算法

引用本文：	赵钊,原培新,唐俊文,陈锦林.基于改进SNN-HRL的智能体路径规划算法[J].东北大学学报(自然科学版),2023(11):1548-1555.

作者姓名：	赵钊原培新唐俊文陈锦林

作者单位：	东北大学机械工程与自动化学院

摘要：	针对SNN-HRL等传统Skill discovery类算法存在的探索困难问题，本文基于SNN-HRL算法提出了融合多种探索策略的分层强化学习算法MES-HRL,改进传统分层结构，算法包括探索轨迹、学习轨迹、路径规划三层.在探索轨迹层，训练智能体尽可能多地探索未知环境，为后续的训练过程提供足够的环境状态信息.在学习轨迹层，将探索轨迹层的训练结果作为“先验知识”用于该层训练，提高训练效率.在路径规划层，利用智能体之前获得的skill来完成路径规划任务.通过仿真对比MES-HRL与SNN-HRL算法在不同环境下的性能表现，仿真结果显示，MES-HRL算法解决了传统算法的探索问题，具有更出色的路径规划能力.
关键词：	深度强化学习分层强化学习路径规划探索策略 Skill discovery方法