共查询到20条相似文献,搜索用时 140 毫秒
1.
2.
3.
研究了一种基于智能体动作预测的多智能体强化学习算法. 在多智能体系统中,学习智能体选择动作不可避免地要受到其他智能体执行动作的影响,因此强化学习系统需要考虑多智能体的联合状态和联合动作.基于此,提出使用概率神经网络来预测其他智能体动作的方法,从而构成多智能体联合动作,实现了多智能体强化学习算法. 此外,研究了该方法在足球机器人协作策略学习中的应用,使多机器人系统能够通过与环境的交互学习来掌握行为策略,从而实现多机器人的分工和协作. 相似文献
4.
基于状态预测的多智能体动态协作算法 总被引:2,自引:0,他引:2
针对复杂动态环境下的多智能体协作问题,提出基于信息处理和状态预测的优化动态协作算法.充分考虑其它智能体对环境的影响,采用重要度函数和信息处理方法,对协作所需信息进行筛选和处理.通过引入状态预测算法,在多智能体动态协作过程中对智能体的行为和系统的状态进行预测,以实现协作结构的在线调整,使得多智能体能在内部以新的控制任务或新的平衡状态为目标,进行联合行动的动态协作.通过在典型的复杂动态MAS研究平台--机器人救援仿真比赛系统中应用,验证了该算法的有效性. 相似文献
5.
6.
现阶段,团队认知、自然决策方法和协作理论方面的研究是人工智能方面的热点问题,然而在将自然决策方法应用到多智能体的协作决策方面还需要进行大量的工作.该研究的目的是建立作战仿真中的协作决策模型,在对Klein的RPD模型进行了修改的基础上,提出了协作的SRPD模型,它能够支持多智能体系统态势感知的统一,并能将感知简化和提炼为多智能体的协作决策服务,并将该模型引入到作战仿真多智能体系统中建立了基于协作SRPD模型的多智能体体系.实验表明内核为协作SRPD模型的兵力主体能够对战场环境自主反应,并能够进行协作决策来协调统一团队的行为. 相似文献
7.
针对智能虚拟维修环境中多Agent协同作业求解问题,提出一种基于任务驱动方法的协同虚拟维修训练体系框架,并构建基于该框架下的协作感知-规划-行为(Sense-Plan-Action,SPA)关系模型,在该模型中使用参数化表达方法来量化多Agent 协同作业过程,并将任务求解过程转化为时序信息、属性状态演变、目标决策等多通道框架驱动协同作业的实现,解决了多Agent 协同作业的逻辑关系问题。最后,将该方法应用于轮式工程机械协同虚拟维修仿真过程中,实现了协同虚拟维修可视化,验证了任务驱动方法在协同虚拟训练中的可行性。 相似文献
8.
以发动机叶片铸造过程为工程背景,将Agent理论用于航空材料成形过程质量监控系统的研究,重点研究MAS的体系结构、通信及协作问题.将多Agent系统理论用于叶片铸造过程,把一个复杂系统分解为多个可以协调的易解的智能体.给出了Agent之间的通讯方案及实现方法,从Agent之间的基本通讯行为出发,给出了Agent之间的通讯机制、通讯协议及其形式化,详细研究了Agent之间的协作方式.结合工程项目建立了叶片智能监控系统的通讯模型,并进一步建立了基于XML的MAS通讯其实现方法.基于研究成果,给出了叶片铸造过程智能监控系统实例,为改善叶片铸件质量提供了有效的指导方法. 相似文献
9.
10.
11.
基于遗传算法的车辆ABS在线整定PID控制及仿真 总被引:1,自引:0,他引:1
分析了ABS(防抱制动系统)PID控制方法的原理。提出了基于遗传算法的在线ABS PID控制方法。为了使控制器具有更高的搜索效率以满足ABS的实时性要求,改进了遗传算法的遗传算子,使复制与交叉操作并列存在,使用具有选择性的交叉操作,并改变变异操作的随机性,使其成为受控的随机操作。使系统能根据车辆的运行条件实时整定PID控制参数。仿真结果表明,基于遗传算法的在线ABSPID控制方法能有效抑制超调,控制ABS跟踪路面条件变化。 相似文献
12.
作业车间调度问题(JSSP)是组合优化问题中的NP难问题。本文提出了以适用于JSSP问题的二进制编码遗传算法为基础,在算法中增加了两种启发式算子:激活算子和瓶颈修复算子,并相应调整算法结构,形成混和遗传算法解决JSSP问题。激活算子以GT算法为依据,将种群中部分个体转化为活动调度个体,是一种较有独创性的新算子;瓶颈修复算子对所得结果进一步优化。算例运行结果表明与其它算法相比,该算法在全局搜索能力和运行效率上都有突出的表现。 相似文献
13.
两种人工智能方法应用于地热热泵系统辨识 总被引:8,自引:1,他引:8
本文分别采用神经网络和遗传规划这两种人工智能方法去解决地热热泵系统的辨识问题。由试验所得的检验数据可知,用这两种方法得到的模型的平均误差在7%以内。这说明单纯采用人工智能方法对地热热泵系统进行辨识是可行的。同时通过对两种方法的分析比较得出,遗传规划方法有潜在的能力去解决HVAC领域中的系统优化设计和调控的问题。 相似文献
14.
15.
不确定车辆数的有时间窗车辆路径问题的遗传算法 总被引:27,自引:0,他引:27
给出了不确定车辆数的有时间窗车辆路径问题(VRPTW)的数学模型,提出一种基于客户的编码表示方式,可以表示出不同的车辆数,实现VRPTW的路径长度和车辆数的同时优化,并用计算实例进行了验证,同时对计算中涉及的一些问题进行了讨论. 相似文献
16.
17.
基于神经网络的轮廓误差控制仿真研究 总被引:1,自引:1,他引:0
运动控制系统不同轴的动态特性的差异是造成系统轮廓误差较大的主要原因。为系统每个轴设计一个高性能的前馈补偿器,可以改善每个轴的动态特性,使不同轴相互匹配,从而残小系统的轮廓误差。由于前馈补偿器的传递函数通常具有二阶或二阶以上微分环节,物理实现较困难,本文利用神经网络辨识系统的控制对象逆模型作为前馈补偿器,很好地解决了该问题;而利用在遗传算法中加入BP算法形成的混合遗传算法作为神经网络的训练算法,此算法具有收敛速度快,不易陷入局部权小的特点。 相似文献
18.
19.
20.
基于自适应遗传算法的渠系优化配水模型研究 总被引:3,自引:0,他引:3
针对现有的建立在假定下级渠道配水流量相等基础上的渠道优化配水模型与绝大多数渠系实际配水要求不相符合等问题,研究了下级渠道流量不等时的渠系优化配水模型及其求解方法,并通过实例对基于自适应遗传算法和基本遗传算法的模型求解方法进行了比较。结果表明,与传统方法编制的配水方案相比,提出的模型和算法确定的渠系优化配水方案斗渠配水时间搭配合理、支渠配水流量均匀,符合优化配水原则;利用自适应遗传算法求解模型,能在进化过程中按个体优劣和群体分散程度自动调整遗传控制参数,可显著加快收敛速度和提高计算稳定性,具有较高的工程应用价值。 相似文献