动态环境下多智能体协作学习方法的研究 |
| |
作者姓名: | 王全武 胡晓辉 |
| |
作者单位: | 兰州交通大学电信学院,甘肃兰州,730070 |
| |
摘 要: | 将预测分析技术和强化学习技术有机结合,使多Agent系统中的各Agent,不仅具有了高度反应自适应性,而且拥有了高效而准确的预测分析能力;使Agent的行为更具有针对性,尽可能地减少错误,保证学习的正确方向,提高Agent间进行信息共享,融合单个Agent的Q值表.相当于相同情况下增加了学习次数,不仅尽可能地消除策略中的冗余动作,以高效的方式实现最终目标,而且提高多Agent系统执行效率和收敛速度及性能.本文提出了一种改进的多Agent间协作学习方法,适用于环境不完备的复杂情况.以追捕问题作为仿真实验.结果表明所提方法能够有效地促进多智能体系统中各Agent间协作学习能力.
|
关 键 词: | 多智能体系统 强化学习 协作学习 预测分析技术 追捕问题 黑板模型 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|