基于连续动作学习自动机的联想强化学习 Associative Reinforcement Learning Based on Continuous-Action Learning Automata期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于连续动作学习自动机的联想强化学习

摘要：	联想强化学习是一种在不确定环境下的机器学习问题,其中学习系统的目标是为环境的每一种输入状态确定一个最佳的输出动作。文章提出一种新的连续动作学习自动机(CALA)。该自动机以一个可变区间作为动作集,并依照均匀分布方式产生输出动作。根据环境反馈的成功/失败信号,学习算法对动作区间的端点进行自适应更新。将该方法应用于求解两个经典的联想强化学习问题,仿真结果演示了新算法相对于两种现有的CALA算法的优越性。与旧算法相比,新算法的学习性能平均可提高1.9%到5.7%,最高可提高22.4%到65.2%。
Associative Reinforcement Learning Based on Continuous-Action Learning Automata

Abstract:

Keywords:
本文献已被 CNKI 万方数据等数据库收录！