集成规划的行动-自适应评价强化学习算法 An Integrating Planning Actor-Adaptive Critic Reinforcement Learning Algorithm期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

集成规划的行动-自适应评价强化学习算法

引用本文：	李春贵,刘永信,王萌.集成规划的行动-自适应评价强化学习算法[J].内蒙古大学学报(自然科学版),2008,39(3):346-350.

作者姓名：	李春贵刘永信王萌

作者单位：	1. 广西工学院计算机工程系,柳州,545006 2. 内蒙古大学电子信息工程学院,呼和浩特,010021

基金项目：	广西自然科学基金 , 广西工学院校科研和教改项目 , 教育部科学技术研究重点项目 , 内蒙古大学校科研和教改项目 , 内蒙古大学513人才计划

摘要：	研究了行动-自适应评价强化学习方法,考虑到行动器所采取的探索策略对学习性能的影响,利用混合探索策略进行探索;分析学习和规划的特点,在评价器中应用集成模型学习和无模型学习的学习方法,在行动器应用新的混合探索策略,提出一种集成规划的行动-自适应评价强化学习算法并进行仿真实验,实验结果表明,新算法有较好的学习效果.
关键词：	强化学习行动评价规划探索策略
文章编号：	1000-1638(2008)03-0346-05
修稿时间：	2007年4月27日
An Integrating Planning Actor-Adaptive Critic Reinforcement Learning Algorithm

LI Chun-gui,LIU Yong-xin,WANG Meng.An Integrating Planning Actor-Adaptive Critic Reinforcement Learning Algorithm[J].Acta Scientiarum Naturalium Universitatis Neimongol,2008,39(3):346-350.

Authors:	LI Chun-gui LIU Yong-xin WANG Meng

Abstract:

Keywords:
本文献已被维普万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏