机器人足球中3打2战术的强化学习 |
| |
引用本文: | 方宝富,王浩.机器人足球中3打2战术的强化学习[J].合肥工业大学学报(自然科学版),2002,25(Z1):1029-1032. |
| |
作者姓名: | 方宝富 王浩 |
| |
作者单位: | 合肥工业大学,计算机与信息学院,安徽,合肥,230009 |
| |
摘 要: | 通过对机器人足球中的agent进行强化学习,研究连续性决策问题;介绍了机器人足球竞赛策略的一个子问题3打2战术.然后在这个分布的、实时、局部可观察的、有噪音的领域内,提出一种能够强化学习的思维来进行策略评价和动作选择的方法.实验结果证明,该文提出的自学习的策略明显优于Hand-Coded策略.
|
关 键 词: | 3打2战术 强化学习 逼近函数 |
文章编号: | 1003-5060(2002)S1-1029-04 |
修稿时间: | 2002年6月10日 |
Reinforcement learning for the 3 vs 2 keepaway in robotic soccer |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|