首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于隐偏向信息学习的强化学习算法
引用本文:李学勇,欧阳柳波,李国徽.基于隐偏向信息学习的强化学习算法[J].南华大学学报(自然科学版),2004,18(2):10-16.
作者姓名:李学勇  欧阳柳波  李国徽
作者单位:1. 长沙大学数学与信息科学系,湖南,长沙,410003
2. 湖南大学软件学院,湖南,长沙,410082
3. 华中科技大学计算机科学与技术学院,湖北,武汉,430074
基金项目:国家自然科学基金资助项目(6020317),国家科技基础性研究专项资金项目(2001DE20016-02-04).
摘    要:传统的强化学习算法应用到大状态、动作空间和任务复杂的马尔可夫决策过程问题时,存在收敛速度慢,训练时间长等问题.有效地学习和利用问题中包含的偏向信息可以加快学习速度,提高学习效率.在分析了偏向机制特点的基础上引入了隐偏向信息的概念,建立了一种基于偏向信息学习的强化学习模型,并提出了一种基于特征的改进SARSA(λ)算法.针对于推箱任务的实验表明,改进的算法明显提高了学习效率.

关 键 词:强化学习  Markov决策过程  偏向  隐偏向信息  SARSA(λ)算法
文章编号:1006-737X(2004)02-0010-07
修稿时间:2004年2月16日

Reinforcement Learning Based on Hidden Biasing Information Learning
LI Xue-yong,OUYANG Liu-bo,LI Guo-hui.Reinforcement Learning Based on Hidden Biasing Information Learning[J].Journal of Nanhua University:Science and Technology,2004,18(2):10-16.
Authors:LI Xue-yong  OUYANG Liu-bo  LI Guo-hui
Institution:LI Xue-yong~1,OUYANG Liu-bo~2,LI Guo-hui~3
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《南华大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《南华大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号