首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
研究了一种基于智能体动作预测的多智能体强化学习算法. 在多智能体系统中,学习智能体选择动作不可避免地要受到其他智能体执行动作的影响,因此强化学习系统需要考虑多智能体的联合状态和联合动作.基于此,提出使用概率神经网络来预测其他智能体动作的方法,从而构成多智能体联合动作,实现了多智能体强化学习算法. 此外,研究了该方法在足球机器人协作策略学习中的应用,使多机器人系统能够通过与环境的交互学习来掌握行为策略,从而实现多机器人的分工和协作.  相似文献   

2.
基于均匀设计的多智能体遗传算法研究   总被引:3,自引:0,他引:3  
将均匀设计方法、多智能体系统与遗传算法相结合,提出了一种多智能体遗传算法.设计了基于均匀设计表的均匀种群初始化方法和均匀交叉算子,并将其引入算法中.算法通过智能体与智能体环境间的相互作用,以及智能体自学习提高自身能量,实现了复杂问题的全局优化目标.实验表明,该算法对于高维函数优化问题,尤其是高维多峰函数,具有很好的全局搜索能力和较快的收敛速度,能够避免陷入局部最优.  相似文献   

3.
研究了具有参考状态的有向通信时延多智能体系统的信息一致性问题.提出了适用于可连续通信并有通信时延的有向多智能体系统关于参考状态的一致性算法,严格推导了多智能体系统在该算法作用下达到信息一致性的充分性判据,最后以水下无人航行器协同作战为背景,仿真验证了所提出的一致性算法和判据的有效性.  相似文献   

4.
为防止多智能体集群跟随多个领导者时编队混乱,提出了3种K-means聚类算法,将集群分成与领导者数量相同的社区,社区内的智能体将跟随同一领导者。所提出的3种算法中,算法1适用于智能体分布空间广的场景,系统达到一致性所需时间最短;算法2则适用于智能体分布稀疏的场景,可有效避免智能体碰撞等危险;算法3则大大降低多智能体集群的控制成本,但将会牺牲系统的收敛速度。相较于传统预先对智能体编号,领导-跟随关系固定的方法,本文提出的分簇方法使系统收敛时间更短,且有效应对中途任务变更的情况,可快速分配给智能体新的合适任务。  相似文献   

5.
机器人焊接柔性制造系统的多智能体协调控制   总被引:1,自引:1,他引:0  
提出了利用分布式的多智能体协调控制技术实现对焊接柔性制造系统进行控制的思想。通过对集成多机器人和多传感器的焊接柔性制造系统进行焊接生产任务执行过程的分析,提出了针对焊接柔性制造系统的多智能体控制系统结构。最后利用JADE多智能体系统开发平台建立了一个多智能体控制系统,并通过实验验证了该系统的有效性及合理性。  相似文献   

6.
基于状态预测的多智能体动态协作算法   总被引:2,自引:0,他引:2  
彭军  刘亚  吴敏  蒋富  张晓勇 《系统仿真学报》2008,20(20):5511-5515
针对复杂动态环境下的多智能体协作问题,提出基于信息处理和状态预测的优化动态协作算法.充分考虑其它智能体对环境的影响,采用重要度函数和信息处理方法,对协作所需信息进行筛选和处理.通过引入状态预测算法,在多智能体动态协作过程中对智能体的行为和系统的状态进行预测,以实现协作结构的在线调整,使得多智能体能在内部以新的控制任务或新的平衡状态为目标,进行联合行动的动态协作.通过在典型的复杂动态MAS研究平台--机器人救援仿真比赛系统中应用,验证了该算法的有效性.  相似文献   

7.
在层次包围盒的基础上,提出一种基于多智能体粒子群的快速碰撞检测方法.算法首先利用层次包围盒方法快速减小物体间可能发生的碰撞检测区域,并基于随机碰撞检测核心思想将问题转变为物体特征对间距离机制的非线性优化问题,在建立的层次拓扑结构基础上,结合多智能体系统技术和粒子群算法的进化策略,设计了一种多智能体粒子群算法来求解碰撞检测问题.通过仿真测试表明,该算法具有很高的搜索效率和寻优性能,能够满足碰撞检测的实时性要求.  相似文献   

8.
认知无线电和动态频谱分配技术是解决频谱资源短缺问题的有效手段。随着近年来深度学习和强化学习等机器学习技术迅速发展, 以多智能体强化学习为代表的群体智能技术不断取得突破, 使得分布式智能动态频谱分配成为可能。本文详细梳理了强化学习和多智能体强化学习领域关键研究成果, 以及基于多智能体强化学习的动态频谱分配过程建模方法与算法研究。并将现有算法归结为独立Q-学习、合作Q-学习、联合Q-学习和多智能体行动器-评判器算法4种, 分析了这些方法的优点与不足, 总结并给出了基于多智能体强化学习的动态频谱分配方法的关键问题与解决思路。  相似文献   

9.
针对多智能体系统在处理复杂任务时存在的低效率、高冗积、多智能体系统内协同模型算法存在交互冲突、资源损耗过高等问题, 提出一种基于复杂任务的多智能体系统优化算法。在差分进化算法与局部优化算法的基础上对二者进行优化, 结合强化学习的训练框架, 构建训练网络, 通过对学习步长进行修订, 改变种群迭代优化准则, 使得种群在计算力充足的情况下可以实现全局收益最大化, 有效解决了指挥控制系统过程中的协同优化问题。  相似文献   

10.
基于细胞免疫应答理论重建故障诊断智能体   总被引:6,自引:2,他引:4  
借鉴生物免疫中的独特性网络调节理论,将进化的单一诊断Agent对应为免疫系统中的抗体,诊断系统中多Agent群体适应度增加量作为抗原,并依据生物系统的相似性理论,构造了诊断多智能体的细胞免疫型智能体重构控制的结构模型;提出了一种基于行为Petri网技术的工作流模型重建故障诊断智能体的算法,实现故障诊断系统中的多智能体的群体进化,自组织与突破,并给出Agent重构的非线性动力学解释。  相似文献   

11.
12.
13.
14.
正August 10-14,2015Beijing,ChinaThe International Congress on Industrial and Applied Mathematics(ICIAM)is the premier international congress in the field of applied mathematics held every four years under the auspices of the International Council for Industrial and Applied Mathematics.From August 10 to 14,2015,mathematicians,scientists  相似文献   

15.
16.
17.
18.
正AF:Any Field The School of Economics and Management at Tsinghua University(Tsinghua SEM)invites applications for faculty positions at all levels(Assistant Professor,Associate Professor and Full Professor)in any fields of business administration and management.Tsinghua SEM is the only school  相似文献   

19.
Enterprise resource planning implementation decision & optimization models   总被引:2,自引:0,他引:2  
To study the uncertain optimization problems on implementation schedule, time-cost trade-off and quality in enterprise resource planning (ERP) implementation, combined with program evaluation and review technique (PERT), some optimization models are proposed, which include the implementation schedule model, the timecost trade-off model, the quality model, and the implementation time-cost-quality synthetic optimization model. A PERT-embedded genetic algorithm (GA) based on stochastic simulation technique is introduced to the optimization models solution. Finally, an example is presented to show that the models and algorithm are reasonable and effective, which can offer a reliable quantitative decision method for ERP implementation.  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号