首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于贝叶斯方法的多Agent强化学习
引用本文:郑顾平,曹锦纲.基于贝叶斯方法的多Agent强化学习[J].河北理工大学学报(自然科学版),2005,27(4).
作者姓名:郑顾平  曹锦纲
摘    要:在多agentss强化学习(MARL)的研究中,很多都是强调MARL算法收敛于期望平衡解.然而,对于标准的强化学习,该过程需要对策略空间的充分探测,而且探测还经常受到惩罚或错失了良机.在多agents系统中,由于agents之间的协作使该问题更加复杂.为此,提出了在MARL用贝叶斯模型来进行最优探测,该模型与标准的RL模型不同,它将对agent的动作是如何影响其它agents的行为进行推理.同时,还给出了如何对最优贝叶斯探测进行处理以获得理想的结果,并通过与其它算法的比较来说明用贝叶斯方法的可行性.

关 键 词:贝叶斯方法  多agents  强化学习

The Multiagent Reinforcement Learning Based on Bayesian Approacll
ZHENG Gu-ping,CAO Jin-gang.The Multiagent Reinforcement Learning Based on Bayesian Approacll[J].Journal of Hebei Institute of Technology(Natural Science Edition),2005,27(4).
Authors:ZHENG Gu-ping  CAO Jin-gang
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号