首页 | 本学科首页   官方微博 | 高级检索  
     检索      

多agent协同强化学习算法SE-MACOL及其应用
引用本文:王长缨,陈文伟.多agent协同强化学习算法SE-MACOL及其应用[J].广西师范大学学报(自然科学版),2006,24(4):167-170.
作者姓名:王长缨  陈文伟
作者单位:1. 济南军区装备部,自动化站,山东,济南,250002
2. 国防科技大学,信息系统与管理学院,湖南,长沙,410073
基金项目:国家自然科学基金资助项目(70371008)
摘    要:针对多agent团队中各成员之间是协作关系且自主决策的学习模型,在此对Q学习算法进行了适当扩充,提出了适合于多agent团队的一种共享经验元组的多agent协同强化学习算法。其中采用新的状态行为的知识表示方法,采用相似性变换和经验元组的共享,能够提高多agent团队协同工作的效率。最后将该算法应用于猎人捕物问题域,实验结果表明该算法能够明显加快多个猎人合作抓捕猎物的进程。

关 键 词:多agent学习  强化学习  Q学习  状态行为空间  协作团队
文章编号:1001-6600(2006)04-0167-04
收稿时间:2006-05-31
修稿时间:2006年5月31日

Multi-agent Cooperative Reinforcement Learning Algorithm SE-MACOL and Its Application
WANG Chang-ying,CHEN Wen-wei.Multi-agent Cooperative Reinforcement Learning Algorithm SE-MACOL and Its Application[J].Journal of Guangxi Normal University(Natural Science Edition),2006,24(4):167-170.
Authors:WANG Chang-ying  CHEN Wen-wei
Institution:1. Automation Station ,Department of Equipment ,Jinan Military Area ,Jinan 250002 ,China ; 2. School of Information System and Management,National University of Defense Technology,Changsha 410073 ,China
Abstract:
Keywords:multi-agent learning  reinforcement learning  Q-learning  state-action space  cooperative team
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号