首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
研究了一种基于智能体动作预测的多智能体强化学习算法. 在多智能体系统中,学习智能体选择动作不可避免地要受到其他智能体执行动作的影响,因此强化学习系统需要考虑多智能体的联合状态和联合动作.基于此,提出使用概率神经网络来预测其他智能体动作的方法,从而构成多智能体联合动作,实现了多智能体强化学习算法. 此外,研究了该方法在足球机器人协作策略学习中的应用,使多机器人系统能够通过与环境的交互学习来掌握行为策略,从而实现多机器人的分工和协作.  相似文献   

2.
对RoboCupRescue智能体仿真系统内的多智能体协作问题进行了研究和分析,提出一种由多种评价模型和协作方式组成的协作方法,并从同类和异类智能体两个方面给出了具体的实现.该实现主要采用了人工免疫控制、静态分配与动态调整结合以及基于共识的分布式控制等方式.在仿真测试中,各类智能体通过相互协作有效完成了灾难环境中的救援任务.  相似文献   

3.
针对动态环境,提出了一种基于多智能体的进化算法(MAEA).智能体模拟生物机制特征,相互合作来寻求最优解.智能体生存于网格环境中,为了增加自身能量,智能体可以与其邻域展开竞争,并依据统计信息来获得知识进行学习.为了保持种群多样性,同时引入随机移民和对偶映射策略.通过对一系列动态优化函数的仿真实验可以得出,相比之下,基于多智能体的进化算法可以在动态环境中获得更好的性能.  相似文献   

4.
现阶段,团队认知、自然决策方法和协作理论方面的研究是人工智能方面的热点问题,然而在将自然决策方法应用到多智能体的协作决策方面还需要进行大量的工作.该研究的目的是建立作战仿真中的协作决策模型,在对Klein的RPD模型进行了修改的基础上,提出了协作的SRPD模型,它能够支持多智能体系统态势感知的统一,并能将感知简化和提炼为多智能体的协作决策服务,并将该模型引入到作战仿真多智能体系统中建立了基于协作SRPD模型的多智能体体系.实验表明内核为协作SRPD模型的兵力主体能够对战场环境自主反应,并能够进行协作决策来协调统一团队的行为.  相似文献   

5.
通过分析多智能协作问题的研究现状,借鉴自然界中物种之间协同进化机制而得到的协进化计算思想,提出了基于协进化机制的多智能体系结构和协作方法,介绍了协作化智能体的分层设计方法,协进化智能体之间以及智能体与环境之间的交互过程,并设计了基于协进化方法的多智能体系协作系统仿真框架,以多武器平台协同的控制对抗仿真系统为背景进行了实验研究。  相似文献   

6.
基于均匀设计的多智能体遗传算法研究   总被引:3,自引:0,他引:3  
将均匀设计方法、多智能体系统与遗传算法相结合,提出了一种多智能体遗传算法.设计了基于均匀设计表的均匀种群初始化方法和均匀交叉算子,并将其引入算法中.算法通过智能体与智能体环境间的相互作用,以及智能体自学习提高自身能量,实现了复杂问题的全局优化目标.实验表明,该算法对于高维函数优化问题,尤其是高维多峰函数,具有很好的全局搜索能力和较快的收敛速度,能够避免陷入局部最优.  相似文献   

7.
借鉴组织学思想将自适应系统中的自主运行单元抽象为Agent, 把复杂自适应系统视为多Agent组织, 从时间和状态角度对复杂动态系统的行为进行描述, 提出了基于时序活动逻辑的多Agent动态协作任务求解自适应机制和构造模型; 分析了任务求解BDI Agent的信念、愿望、意图的产生过程和实现方法, 建立了协商推理的语义规则和行为规则, 给出了协作群组的选择算法. 并从任务求解Agent的心智变化角度, 描述了动态协作任务求解模型实现的六个阶段: 任务动态分配、协作意愿产生、协作群体生成、共同计划制定、协作群体行动和结果评估. 通过在MAGE等平台上实验和仿真测试, 验证了方法的可行性和有效性.  相似文献   

8.
一种可用于数值优化的一维智能体遗传算法的研究   总被引:2,自引:1,他引:1  
针对复杂寻优问题,提出了一种新的遗传算法-一维智能体遗传算法(CAGA).该算法采用一维链式智能体网络结构,实现动态邻域竞争选择、正交交叉和自适应变异,可更好的保持种群多样性,从而获得较优的优化精度.实验采用了多个多维复杂函数进行了优化实验,结果表明,该遗传算法比其他多个著名优化算法可获得更优的优化结果.  相似文献   

9.
研究了具有参考状态的有向通信时延多智能体系统的信息一致性问题.提出了适用于可连续通信并有通信时延的有向多智能体系统关于参考状态的一致性算法,严格推导了多智能体系统在该算法作用下达到信息一致性的充分性判据,最后以水下无人航行器协同作战为背景,仿真验证了所提出的一致性算法和判据的有效性.  相似文献   

10.
为快速恰当地复用企业现有知识和软件, 提出了将企业的知识管理的业务逻辑与知识处理事务分开, 建立基于多智能体和构件知识服务的知识复用模型, 给出了知识复用系统的定义. 深入研究了知识管理业务逻辑的规则模型和智能体的活动行为模型, 建立了基于多智能体的规则协调模式, 实现对知识服务的敏捷调用, 从而有效地支持知识的动态复用和知识使用过程的动态重组, 增强知识管理系统的分布式处理能力和规模可扩展能力.分布式构件库系统中, 智能体可通过协作联合完成用户的检索要求. 智能体拥有自己的知识库, 并且具备学习能力, 能更新其知识库以保持检索结果的有效性. 最后, 通过一个实例进一步说明了所给模型的应用.  相似文献   

11.
A lot of routing algorithms have been proposed for low earth orbit(LEO) satellite IP networks in recent years,but most of them cannot achieve global optimization.The dynamic characters of LEO satellite networks are reflected in two aspects:topology and traffic change.The algorithms mentioned above are hard routing which only realize local optimization.A distributed soft routing algorithm combined with multi-agent system(MASSR) is proposed.In MASSR,mobile agents are used to gather routing information activel...  相似文献   

12.
多智能体深度确定性策略梯度(multi-agent deep deterministic policy gradient,MADDPG)算法是深度强化学习方法在多智能体系统(multi-agent system,MAS)领域的重要运用,为提升算法性能,提出基于并行优先经验回放机制的MADDPG算法.分析算法框架及训练方...  相似文献   

13.
基于MAS的多UAV协同任务分配设计与仿真   总被引:1,自引:1,他引:1  
廖沫  陈宗基  周锐 《系统仿真学报》2007,19(10):2313-2317
对多无人机UAV(Uninhabited Aerial Vehicle)协同任务问题,提出了基于多智能体系统MAS(Multi-Agent System)的系统框架;对多UAV协同目标分配问题建立了数学模型,提出基于Agent的分布协同拍卖的动态任务分配算法,通过多Agent拍卖实现目标分配;建立了多UAV仿真系统,基于HLA/RTI和知识共享与操作语言KQML(Knowledge Queryand Manipulate Language)实现多UAV系统中各Agent的交互;仿真系统能方便有效的仿真多机协同问题,对目标分配问题的仿真结果表明,目标分配算法具有良好的优化效果和时间特性,能够满足一般战场的实时性需求。  相似文献   

14.
针对智能虚拟维修环境中多Agent协同作业求解问题,提出一种基于任务驱动方法的协同虚拟维修训练体系框架,并构建基于该框架下的协作感知-规划-行为(Sense-Plan-Action,SPA)关系模型,在该模型中使用参数化表达方法来量化多Agent 协同作业过程,并将任务求解过程转化为时序信息、属性状态演变、目标决策等多通道框架驱动协同作业的实现,解决了多Agent 协同作业的逻辑关系问题。最后,将该方法应用于轮式工程机械协同虚拟维修仿真过程中,实现了协同虚拟维修可视化,验证了任务驱动方法在协同虚拟训练中的可行性。  相似文献   

15.
实现战术态势估计的一种多agent计划识别方法   总被引:1,自引:0,他引:1  
利用目标编群思想描述多agent行动之间的协作关系,建立了一种基于多agent计划识别的战术态势估计模型。分析了计划库的构成及结构层次,给出了一种基于多agent假设的计划识别算法。以一阶谓词逻辑为形式语言,扩展了战术智能规划的一个实例,引入了描述多agent完成同一任务的谓词和算子。对实例的分析说明了基于多agent计划识别的态势估计过程,表明了使用该方法求解态势估计问题的可行性。  相似文献   

16.
一种基于FIRE模型的Agent联合测谎算法   总被引:2,自引:0,他引:2  
FIRE模型改进了SPORAS模型,更适用于开放性的问题求解要求。检测相互合作的Agent是否说谎、以及对说谎现象进行有效控制能够提高多Agent系统模型的实用价值。基于FIRE模型,提出一种对说谎Agent进行联合测度与控制的算法,是对Zacharia和Jennings等人关于多Agent系统信任和名誉模型的研究工作的进一步延续。  相似文献   

17.
曹璐  陈小前 《系统仿真学报》2012,24(7):1401-1405,1411
由于传统的增广卡尔曼滤波方法难以有效解决带有未知参数估计的强非线性、非高斯动力学问题。针对这一问题,在对粒子滤波算法研究的基础上提出了基于近似思想的增广粒子滤波方法。这一方法利用高斯随机游走模型对未知参数进行增广建模,再通过粒子滤波方法进行状态估计。为了提高观测新息的利用率,提出了一种新的重要性函数;针对高斯随机游走模型方差不断增大的问题,采用了修改后的Kernel平滑模型进行解决;对粒子重采样方法进行了修改,采用了混合重采样的策略,增强了粒子活性。通过算例进行仿真,验证了算法的有效性。  相似文献   

18.
将人工智能应用于兵棋推演的智能战术兵棋正逐年发展,基于Actor-Critic框架的决策方法可以实现智能战术兵棋的战术行动动态决策.但若Critic网络只对单算子进行评价,多算子之间的网络没有协同,本方算子之间各自行动决策会不够智能.针对上述方法的不足,提出了一种基于强化学习并结合规则的多智能体决策方法,以提升兵棋推演...  相似文献   

19.
针对基于移动代理的大规模网络拓扑发现,提出了一种基于移动代理洪泛的自启发式深度优先染色生成树算法。将一个大规模网络划分为若干个子网,在各子网内部利用移动代理洪泛策略并行地获取各子网拓扑信息。利用移动代理将每个子网拓扑信息进行汇总获得整个网络的拓扑。算法的复杂度分析和仿真结果表明本算法可在一定程度上减少网络流量和拓扑周期。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号