首页 | 本学科首页   官方微博 | 高级检索  
     检索      

动态环境下多智能体协作学习方法的研究
引用本文:王全武,胡晓辉.动态环境下多智能体协作学习方法的研究[J].科技咨询导报,2011(9):253-254.
作者姓名:王全武  胡晓辉
作者单位:兰州交通大学电信学院,甘肃兰州,730070
摘    要:将预测分析技术和强化学习技术有机结合,使多Agent系统中的各Agent,不仅具有了高度反应自适应性,而且拥有了高效而准确的预测分析能力;使Agent的行为更具有针对性,尽可能地减少错误,保证学习的正确方向,提高Agent间进行信息共享,融合单个Agent的Q值表.相当于相同情况下增加了学习次数,不仅尽可能地消除策略中的冗余动作,以高效的方式实现最终目标,而且提高多Agent系统执行效率和收敛速度及性能.本文提出了一种改进的多Agent间协作学习方法,适用于环境不完备的复杂情况.以追捕问题作为仿真实验.结果表明所提方法能够有效地促进多智能体系统中各Agent间协作学习能力.

关 键 词:多智能体系统  强化学习  协作学习  预测分析技术  追捕问题  黑板模型
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号