共查询到19条相似文献,搜索用时 187 毫秒
1.
研究了一种基于智能体动作预测的多智能体强化学习算法. 在多智能体系统中,学习智能体选择动作不可避免地要受到其他智能体执行动作的影响,因此强化学习系统需要考虑多智能体的联合状态和联合动作.基于此,提出使用概率神经网络来预测其他智能体动作的方法,从而构成多智能体联合动作,实现了多智能体强化学习算法. 此外,研究了该方法在足球机器人协作策略学习中的应用,使多机器人系统能够通过与环境的交互学习来掌握行为策略,从而实现多机器人的分工和协作. 相似文献
2.
3.
4.
现阶段,团队认知、自然决策方法和协作理论方面的研究是人工智能方面的热点问题,然而在将自然决策方法应用到多智能体的协作决策方面还需要进行大量的工作.该研究的目的是建立作战仿真中的协作决策模型,在对Klein的RPD模型进行了修改的基础上,提出了协作的SRPD模型,它能够支持多智能体系统态势感知的统一,并能将感知简化和提炼为多智能体的协作决策服务,并将该模型引入到作战仿真多智能体系统中建立了基于协作SRPD模型的多智能体体系.实验表明内核为协作SRPD模型的兵力主体能够对战场环境自主反应,并能够进行协作决策来协调统一团队的行为. 相似文献
5.
6.
7.
借鉴组织学思想将自适应系统中的自主运行单元抽象为Agent, 把复杂自适应系统视为多Agent组织, 从时间和状态角度对复杂动态系统的行为进行描述, 提出了基于时序活动逻辑的多Agent动态协作任务求解自适应机制和构造模型; 分析了任务求解BDI Agent的信念、愿望、意图的产生过程和实现方法, 建立了协商推理的语义规则和行为规则, 给出了协作群组的选择算法. 并从任务求解Agent的心智变化角度, 描述了动态协作任务求解模型实现的六个阶段: 任务动态分配、协作意愿产生、协作群体生成、共同计划制定、协作群体行动和结果评估. 通过在MAGE等平台上实验和仿真测试, 验证了方法的可行性和有效性. 相似文献
8.
9.
研究了具有参考状态的有向通信时延多智能体系统的信息一致性问题.提出了适用于可连续通信并有通信时延的有向多智能体系统关于参考状态的一致性算法,严格推导了多智能体系统在该算法作用下达到信息一致性的充分性判据,最后以水下无人航行器协同作战为背景,仿真验证了所提出的一致性算法和判据的有效性. 相似文献
10.
为快速恰当地复用企业现有知识和软件, 提出了将企业的知识管理的业务逻辑与知识处理事务分开, 建立基于多智能体和构件知识服务的知识复用模型, 给出了知识复用系统的定义. 深入研究了知识管理业务逻辑的规则模型和智能体的活动行为模型, 建立了基于多智能体的规则协调模式, 实现对知识服务的敏捷调用, 从而有效地支持知识的动态复用和知识使用过程的动态重组, 增强知识管理系统的分布式处理能力和规模可扩展能力.分布式构件库系统中, 智能体可通过协作联合完成用户的检索要求. 智能体拥有自己的知识库, 并且具备学习能力, 能更新其知识库以保持检索结果的有效性. 最后, 通过一个实例进一步说明了所给模型的应用. 相似文献
11.
Zihe Gao Qing Guo Zhenyu Na .Communication Research Center Harbin Institute of Technology Harbin P.R.China .School of Information Science Technology Dalian Maritime University Dalian 《系统工程与电子技术(英文版)》2011,(6):917-925
A lot of routing algorithms have been proposed for low earth orbit(LEO) satellite IP networks in recent years,but most of them cannot achieve global optimization.The dynamic characters of LEO satellite networks are reflected in two aspects:topology and traffic change.The algorithms mentioned above are hard routing which only realize local optimization.A distributed soft routing algorithm combined with multi-agent system(MASSR) is proposed.In MASSR,mobile agents are used to gather routing information activel... 相似文献
12.
多智能体深度确定性策略梯度(multi-agent deep deterministic policy gradient,MADDPG)算法是深度强化学习方法在多智能体系统(multi-agent system,MAS)领域的重要运用,为提升算法性能,提出基于并行优先经验回放机制的MADDPG算法.分析算法框架及训练方... 相似文献
13.
基于MAS的多UAV协同任务分配设计与仿真 总被引:1,自引:1,他引:1
对多无人机UAV(Uninhabited Aerial Vehicle)协同任务问题,提出了基于多智能体系统MAS(Multi-Agent System)的系统框架;对多UAV协同目标分配问题建立了数学模型,提出基于Agent的分布协同拍卖的动态任务分配算法,通过多Agent拍卖实现目标分配;建立了多UAV仿真系统,基于HLA/RTI和知识共享与操作语言KQML(Knowledge Queryand Manipulate Language)实现多UAV系统中各Agent的交互;仿真系统能方便有效的仿真多机协同问题,对目标分配问题的仿真结果表明,目标分配算法具有良好的优化效果和时间特性,能够满足一般战场的实时性需求。 相似文献
14.
针对智能虚拟维修环境中多Agent协同作业求解问题,提出一种基于任务驱动方法的协同虚拟维修训练体系框架,并构建基于该框架下的协作感知-规划-行为(Sense-Plan-Action,SPA)关系模型,在该模型中使用参数化表达方法来量化多Agent 协同作业过程,并将任务求解过程转化为时序信息、属性状态演变、目标决策等多通道框架驱动协同作业的实现,解决了多Agent 协同作业的逻辑关系问题。最后,将该方法应用于轮式工程机械协同虚拟维修仿真过程中,实现了协同虚拟维修可视化,验证了任务驱动方法在协同虚拟训练中的可行性。 相似文献
15.
实现战术态势估计的一种多agent计划识别方法 总被引:1,自引:0,他引:1
利用目标编群思想描述多agent行动之间的协作关系,建立了一种基于多agent计划识别的战术态势估计模型。分析了计划库的构成及结构层次,给出了一种基于多agent假设的计划识别算法。以一阶谓词逻辑为形式语言,扩展了战术智能规划的一个实例,引入了描述多agent完成同一任务的谓词和算子。对实例的分析说明了基于多agent计划识别的态势估计过程,表明了使用该方法求解态势估计问题的可行性。 相似文献
16.
17.
由于传统的增广卡尔曼滤波方法难以有效解决带有未知参数估计的强非线性、非高斯动力学问题。针对这一问题,在对粒子滤波算法研究的基础上提出了基于近似思想的增广粒子滤波方法。这一方法利用高斯随机游走模型对未知参数进行增广建模,再通过粒子滤波方法进行状态估计。为了提高观测新息的利用率,提出了一种新的重要性函数;针对高斯随机游走模型方差不断增大的问题,采用了修改后的Kernel平滑模型进行解决;对粒子重采样方法进行了修改,采用了混合重采样的策略,增强了粒子活性。通过算例进行仿真,验证了算法的有效性。 相似文献
18.
将人工智能应用于兵棋推演的智能战术兵棋正逐年发展,基于Actor-Critic框架的决策方法可以实现智能战术兵棋的战术行动动态决策.但若Critic网络只对单算子进行评价,多算子之间的网络没有协同,本方算子之间各自行动决策会不够智能.针对上述方法的不足,提出了一种基于强化学习并结合规则的多智能体决策方法,以提升兵棋推演... 相似文献
19.
针对基于移动代理的大规模网络拓扑发现,提出了一种基于移动代理洪泛的自启发式深度优先染色生成树算法。将一个大规模网络划分为若干个子网,在各子网内部利用移动代理洪泛策略并行地获取各子网拓扑信息。利用移动代理将每个子网拓扑信息进行汇总获得整个网络的拓扑。算法的复杂度分析和仿真结果表明本算法可在一定程度上减少网络流量和拓扑周期。 相似文献