基于隐偏向信息学习的强化学习算法 Reinforcement Learning Based on Hidden Biasing Information Learning期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于隐偏向信息学习的强化学习算法

引用本文：	李学勇,欧阳柳波,李国徽.基于隐偏向信息学习的强化学习算法[J].南华大学学报(自然科学版),2004,18(2):10-16.

作者姓名：	李学勇欧阳柳波李国徽

作者单位：	1. 长沙大学数学与信息科学系,湖南,长沙,410003 2. 湖南大学软件学院,湖南,长沙,410082 3. 华中科技大学计算机科学与技术学院,湖北,武汉,430074

基金项目：	国家自然科学基金资助项目(6020317)，国家科技基础性研究专项资金项目(2001DE20016-02-04).

摘要：	传统的强化学习算法应用到大状态、动作空间和任务复杂的马尔可夫决策过程问题时,存在收敛速度慢,训练时间长等问题.有效地学习和利用问题中包含的偏向信息可以加快学习速度,提高学习效率.在分析了偏向机制特点的基础上引入了隐偏向信息的概念,建立了一种基于偏向信息学习的强化学习模型,并提出了一种基于特征的改进SARSA(λ)算法.针对于推箱任务的实验表明,改进的算法明显提高了学习效率.
关键词：	强化学习 Markov决策过程偏向隐偏向信息 SARSA(λ)算法
文章编号：	1006-737X(2004)02-0010-07
修稿时间：	2004年2月16日
Reinforcement Learning Based on Hidden Biasing Information Learning

LI Xue-yong,OUYANG Liu-bo,LI Guo-hui.Reinforcement Learning Based on Hidden Biasing Information Learning[J].Journal of Nanhua University:Science and Technology,2004,18(2):10-16.

Authors:	LI Xue-yong OUYANG Liu-bo LI Guo-hui

Institution:	LI Xue-yong~1,OUYANG Liu-bo~2,LI Guo-hui~3

Abstract:

Keywords:
本文献已被 CNKI 万方数据等数据库收录！
	点击此处可从《南华大学学报(自然科学版)》浏览原始摘要信息
	点击此处可从《南华大学学报(自然科学版)》下载免费的PDF全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏