首页 | 本学科首页   官方微博 | 高级检索  
     检索      

集成规划的行动-自适应评价强化学习算法
引用本文:李春贵,刘永信,王萌.集成规划的行动-自适应评价强化学习算法[J].内蒙古大学学报(自然科学版),2008,39(3):346-350.
作者姓名:李春贵  刘永信  王萌
作者单位:1. 广西工学院计算机工程系,柳州,545006
2. 内蒙古大学电子信息工程学院,呼和浩特,010021
基金项目:广西自然科学基金 , 广西工学院校科研和教改项目 , 教育部科学技术研究重点项目 , 内蒙古大学校科研和教改项目 , 内蒙古大学513人才计划
摘    要:研究了行动-自适应评价强化学习方法,考虑到行动器所采取的探索策略对学习性能的影响,利用混合探索策略进行探索;分析学习和规划的特点,在评价器中应用集成模型学习和无模型学习的学习方法,在行动器应用新的混合探索策略,提出一种集成规划的行动-自适应评价强化学习算法并进行仿真实验,实验结果表明,新算法有较好的学习效果.

关 键 词:强化学习  行动  评价  规划  探索策略
文章编号:1000-1638(2008)03-0346-05
修稿时间:2007年4月27日

An Integrating Planning Actor-Adaptive Critic Reinforcement Learning Algorithm
LI Chun-gui,LIU Yong-xin,WANG Meng.An Integrating Planning Actor-Adaptive Critic Reinforcement Learning Algorithm[J].Acta Scientiarum Naturalium Universitatis Neimongol,2008,39(3):346-350.
Authors:LI Chun-gui  LIU Yong-xin  WANG Meng
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号