排序方式: 共有4条查询结果,搜索用时 0 毫秒
1
1.
在多agentss强化学习(MARL)的研究中,很多都是强调MARL算法收敛于期望平衡解.然而,对于标准的强化学习,该过程需要对策略空间的充分探测,而且探测还经常受到惩罚或错失了良机.在多agents系统中,由于agents之间的协作使该问题更加复杂.为此,提出了在MARL用贝叶斯模型来进行最优探测,该模型与标准的RL模型不同,它将对agent的动作是如何影响其它agents的行为进行推理.同时,还给出了如何对最优贝叶斯探测进行处理以获得理想的结果,并通过与其它算法的比较来说明用贝叶斯方法的可行性. 相似文献
2.
在多agentss强化学习(MARL)的研究中,很多都是强调MARL算法收敛于期望平衡解。然而,对于标准的强化学习,该过程需要对策略空间的充分探测,而且探测还经常受到惩罚或错失了良机。在多agents系统中,由于agents之间的协作使该问题更加复杂。为此,提出了在MARL用贝叶斯模型来进行最优探测,该模型与标准的RL模型不同,它将对agent的动作是如何影响其它agents的行为进行推理。同时,还给出了如何对最优贝叶斯探测进行处理以获得理想的结果,并通过与其它算法的比较来说明用贝叶斯方法的可行性. 相似文献
3.
云计算环境下,为了提高主机资源利用率和保证性能,考虑了主机负载因素的影响,提出了一种基于负载预测的虚拟机资源优化分配方案。通过预测主机负载情况,过滤掉即将达到警告值的主机,保证主机性能,防止虚拟机因负载过重发生不必要的迁移;对参与分配的物理机进行资源最大化利用分配,提高物理主机的资源利用率。通过仿真实验对该方案进行验证。实验结果表明该方案在保证了主机性能的同时提高了资源利用率。 相似文献
4.
基于复杂的虚拟战场环境仿真及三维游戏的高逼真度要求,多分辨率动态地形的实时可视化,近年来在国内外得到了普遍的重视和研究。在前期初步研究动态地形的表示及动态地形多分辨率实时可视化的基础上,基于ROAM静态地形算法的动态扩充,设计了弹坑实时可视化系统的仿真管理。并初步实现了战场环境中弹坑的实时可视化。 相似文献
1