动态环境下多智能体协作学习方法的研究期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

动态环境下多智能体协作学习方法的研究

引用本文：	王全武,胡晓辉.动态环境下多智能体协作学习方法的研究[J].科技咨询导报,2011(9):253-254.

作者姓名：	王全武胡晓辉

作者单位：	兰州交通大学电信学院,甘肃兰州,730070

摘要：	将预测分析技术和强化学习技术有机结合,使多Agent系统中的各Agent,不仅具有了高度反应自适应性,而且拥有了高效而准确的预测分析能力;使Agent的行为更具有针对性,尽可能地减少错误,保证学习的正确方向,提高Agent间进行信息共享,融合单个Agent的Q值表.相当于相同情况下增加了学习次数,不仅尽可能地消除策略中的冗余动作,以高效的方式实现最终目标,而且提高多Agent系统执行效率和收敛速度及性能.本文提出了一种改进的多Agent间协作学习方法,适用于环境不完备的复杂情况.以追捕问题作为仿真实验.结果表明所提方法能够有效地促进多智能体系统中各Agent间协作学习能力.
关键词：	多智能体系统强化学习协作学习预测分析技术追捕问题黑板模型
本文献已被 CNKI 维普万方数据等数据库收录！