基于改进Q-学习的导航知识获取算法研究 Based on Improves the Q-study the Guidance Knowledge Gain Algorithm Research期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于改进Q-学习的导航知识获取算法研究

引用本文：	郑炳文.基于改进Q-学习的导航知识获取算法研究[J].科学之友,2011(6).

作者姓名：	郑炳文

作者单位：	胜利油田海洋采油厂,山东,东营,257000

摘要：	基本Q-学习算法总是利用当前最优策略进行动作的选取,这样容易陷入局部最优.文章在模拟退火强化学习基础上提出了基于探索区域扩张的Q-学习,加入原地探索策略,提高了找到目标的效率;引入了探索区域扩张策略,避免了初始时在整个环境中加入探索的盲目性,提高了学习效率;加入算法的自主学习结束条件,避免了找到最优路径后的重复学习,节省了学习时间.仿真实验验证了算法的有效性.
关键词：	强化学习 Q-学习探索区域扩张模拟退火神经网络
Based on Improves the Q-study the Guidance Knowledge Gain Algorithm Research

Zheng Bingwen.Based on Improves the Q-study the Guidance Knowledge Gain Algorithm Research[J].Friend of Science Amateurs,2011(6).

Authors:	Zheng Bingwen

Abstract:

Keywords:
本文献已被万方数据等数据库收录！