首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于模型的强化学习算法
引用本文:苏浩铭,王浩.一种基于模型的强化学习算法[J].合肥工业大学学报(自然科学版),2008,31(9).
作者姓名:苏浩铭  王浩
基金项目:安徽省自然科学基金,合肥工业大学校科研和教改项目
摘    要:收敛速度是衡量机器学习算法的一个重要指标,在强化学习中,如果算法不充分利用从每次学习中获取的经验知识,算法的收敛速度则比较缓慢;为了提高强化学习的收敛速度,文章将环境模型的学习引入到强化学习过程中,首先学习环境模型,然后根据所得的新模型重新指导强化学习过程,在Linux下的RoboCup仿真平台上对该算法进行了验证,实验结果证明了其有效性.

关 键 词:强化学习  最优策略  模型知识  智能体  机器人足球

A reinforcement learning algorithm based on model
SU Hao-ming,WANG Hao.A reinforcement learning algorithm based on model[J].Journal of Hefei University of Technology(Natural Science),2008,31(9).
Authors:SU Hao-ming  WANG Hao
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号