共查询到20条相似文献,搜索用时 562 毫秒
1.
研究了一种基于智能体动作预测的多智能体强化学习算法. 在多智能体系统中,学习智能体选择动作不可避免地要受到其他智能体执行动作的影响,因此强化学习系统需要考虑多智能体的联合状态和联合动作.基于此,提出使用概率神经网络来预测其他智能体动作的方法,从而构成多智能体联合动作,实现了多智能体强化学习算法. 此外,研究了该方法在足球机器人协作策略学习中的应用,使多机器人系统能够通过与环境的交互学习来掌握行为策略,从而实现多机器人的分工和协作. 相似文献
2.
3.
研究了具有参考状态的有向通信时延多智能体系统的信息一致性问题.提出了适用于可连续通信并有通信时延的有向多智能体系统关于参考状态的一致性算法,严格推导了多智能体系统在该算法作用下达到信息一致性的充分性判据,最后以水下无人航行器协同作战为背景,仿真验证了所提出的一致性算法和判据的有效性. 相似文献
4.
为防止多智能体集群跟随多个领导者时编队混乱,提出了3种K-means聚类算法,将集群分成与领导者数量相同的社区,社区内的智能体将跟随同一领导者。所提出的3种算法中,算法1适用于智能体分布空间广的场景,系统达到一致性所需时间最短;算法2则适用于智能体分布稀疏的场景,可有效避免智能体碰撞等危险;算法3则大大降低多智能体集群的控制成本,但将会牺牲系统的收敛速度。相较于传统预先对智能体编号,领导-跟随关系固定的方法,本文提出的分簇方法使系统收敛时间更短,且有效应对中途任务变更的情况,可快速分配给智能体新的合适任务。 相似文献
5.
6.
基于状态预测的多智能体动态协作算法 总被引:2,自引:0,他引:2
针对复杂动态环境下的多智能体协作问题,提出基于信息处理和状态预测的优化动态协作算法.充分考虑其它智能体对环境的影响,采用重要度函数和信息处理方法,对协作所需信息进行筛选和处理.通过引入状态预测算法,在多智能体动态协作过程中对智能体的行为和系统的状态进行预测,以实现协作结构的在线调整,使得多智能体能在内部以新的控制任务或新的平衡状态为目标,进行联合行动的动态协作.通过在典型的复杂动态MAS研究平台--机器人救援仿真比赛系统中应用,验证了该算法的有效性. 相似文献
7.
8.
认知无线电和动态频谱分配技术是解决频谱资源短缺问题的有效手段。随着近年来深度学习和强化学习等机器学习技术迅速发展, 以多智能体强化学习为代表的群体智能技术不断取得突破, 使得分布式智能动态频谱分配成为可能。本文详细梳理了强化学习和多智能体强化学习领域关键研究成果, 以及基于多智能体强化学习的动态频谱分配过程建模方法与算法研究。并将现有算法归结为独立Q-学习、合作Q-学习、联合Q-学习和多智能体行动器-评判器算法4种, 分析了这些方法的优点与不足, 总结并给出了基于多智能体强化学习的动态频谱分配方法的关键问题与解决思路。 相似文献
9.
针对多智能体系统在处理复杂任务时存在的低效率、高冗积、多智能体系统内协同模型算法存在交互冲突、资源损耗过高等问题, 提出一种基于复杂任务的多智能体系统优化算法。在差分进化算法与局部优化算法的基础上对二者进行优化, 结合强化学习的训练框架, 构建训练网络, 通过对学习步长进行修订, 改变种群迭代优化准则, 使得种群在计算力充足的情况下可以实现全局收益最大化, 有效解决了指挥控制系统过程中的协同优化问题。 相似文献
10.
11.
《系统工程理论与实践》2014,(5)
正August 10-14,2015Beijing,ChinaThe International Congress on Industrial and Applied Mathematics(ICIAM)is the premier international congress in the field of applied mathematics held every four years under the auspices of the International Council for Industrial and Applied Mathematics.From August 10 to 14,2015,mathematicians,scientists 相似文献
12.
13.
14.
《系统科学与系统工程学报(英文版)》2014,(2)
正AF:Any Field The School of Economics and Management at Tsinghua University(Tsinghua SEM)invites applications for faculty positions at all levels(Assistant Professor,Associate Professor and Full Professor)in any fields of business administration and management.Tsinghua SEM is the only school 相似文献
15.
16.
17.
《系统科学与系统工程学报(英文版)》2014,(4)
正June 22-24,2015Guangzhou,China http://iec.cnsba.com/index.htmlCo-Sponsored by:ffiEE SMC(pending)South China University of Technology The Chinese University of Hong Kong Tsinghua UniversityHosted bv:School of Business Administration,South China University of Technology,China Conference Co-Chairs: 相似文献
18.
19.
20.
The paper is about negotiating with issues that discourage innovation. The subject is environmental deterioration, with concern directed at the impediments that keep it from being innovatively resolved. The paper is organized around three issues. (1) The dominant model of environmental concern, called environmental protection, is managed predominantly via command and control approaches. (2) Command and control, by relying on analytical segmentation to subdivide the problem into digestible bits and using formal legislation to direct it, are not up to emerging challenges in the area. (3) More robust models are available but difficult to experiment with due to impediments that discourage change. These impediments are seen in ideals associated with protection, prevention, recycling, and sustainability that tend to do more to sustain harmful practices than to seek beneficial alternatives. Being able to appreciate the underlying restrictions of entropy could help stimulate a more innovative agenda. These issues are tested via a project funded by the EPA entitled ENERGY STAR Homes. 相似文献