共查询到20条相似文献,搜索用时 171 毫秒
1.
2.
3.
基于多Agent的智能决策生成系统研究 总被引:1,自引:1,他引:1
分析了战略决策模拟系统中引入智能决策生成系统的必要性,介绍了多Agent理论,提出了基于多Agent的智能决策生成系统的框架结构,给出了系统工作流程、Agent结构和实现技术,最后总结了采用多Agent技术实现智能决策生成系统的主要优点。 相似文献
4.
5.
6.
7.
8.
平台级ABM方法及在多传感器仿真演示中的应用 总被引:1,自引:0,他引:1
为了开展未来战争系统作战运用的先期概念技术演示,利用Agent作为智能实体的特性,把战争系统各成员直接映射成相应的Agent,由此提出了平台级基于Agent的建模(ABM)方法.在给出各Agent的定义和工作原理的基础上,采用任务树分解法和产生式规则表达知识的形式,设计了作为仿真演示系统基本单元的Agent.以信息化战场多个情报侦察平台(即多传感器)为例,开发了仿真演示系统.仿真演示结果表明,该系统模型能实现信息化战场上战术分队情报侦察这一客观、动态、复杂、智能过程的分布式仿真. 相似文献
9.
提出一个用于Agent进行任务执行决策的微控算法,以解决Agent在动态环境中所做出的任务执行决策能否满足任务截止期的问题.提出了一个两层结构的实时Agent,其中本地控制层负责Agent的个体行为控制,协作计划层则令Agent能与其它Agent通信及协作.基于以上技术,实现了操作员-UCAV实时交互Agent个体控制及结构,能够适应动态的环境、自动进行任务调度和协调,并能保证任务在复杂环境下的响应时间. 相似文献
10.
滕丽华 《复杂系统与复杂性科学》2008,5(1):81-86
Agent在MAS中的行为在很多方面类似于生物在自然环境中的生态行为,因此,从生态系统角度,基于生态特征研究MAS的工业进化模型是很有意义的,对解决生态工业系统的优化控制有着引人注目的现实意义和发展前景.应用贝叶斯技术和贝叶斯网络为智能Agents和多Agent系统所提供的数学框架和处理工具,可有效地解决Agent研究领域所遇到的知识表示、学习和行为决策问题.生态工业系统中的每个企业可以建模为智能Agent.提出一种基于贝叶斯网的方法来对各企业Agent之间的协作关系进行建模.该方法能有效表达各企业Agent的行为策略之间的因果关系,进而可以对生态工业系统中各企业在不同情况下采取的行为策略进行预测和决策,使得整个生态工业系统的经济效益、社会效益和环境效益达到最优化. 相似文献
11.
基于Agent的体系对抗仿真建模方法研究 总被引:12,自引:2,他引:12
面向信息化战争的武器装备体系对抗仿真,从复杂系统建模的角度对传统系统仿真建模方法提出了严峻挑战。因此,需要以CAS理论为依据,研究新的武器装备体系对抗仿真建模方法,以适应信息化战争模拟的需要。为此,我们在分析体系对抗仿真需求的基础上,从基于Agent的体系对抗仿真建模概念、仿真建模概念框架、仿真建模策略,基于Agent的体系整体“涌现”行为建模等问题入手,探讨了基于Agent的体系对抗仿真建模方法问题,并结合体系对抗仿真实验,研究了基于Agent的实体行为建模、实体交互建模和实体模型结构,提出了基于Agent的体系整体“涌现”行为建模思想和建模规范。 相似文献
12.
基于径向基函数网络的强化学习在机器人足球中的研究 总被引:2,自引:1,他引:1
与监督学习从范例中学习的方式不同,强化学习不需要先验知识,而是具有从经验中学习的能力,将强化学习应用在大状态空间中,必须应用函数逼近的方法,如使用径向基函数网络建立输入和输出的映射关系。本文对基于径向基函数网络的强化学习在机器人足球这样的动态的多智能体环境中的应用进行了研究。实验结果证明了研究方法的可行性。 相似文献
13.
1 .INTRODUCTIONWith theincessant development of wireless communi-cation, wireless location already became a newissue .The former researchers proposed many location algo-rithms . Those algorithms can be separated two kindsbasically: One is ti me of arrival /ti me difference ofarrival (TOA/TDOA) technology; another is angleof arrival ( AOA) technology[1]. However ,for therealization of AOAtechnology need the array anten-na ,it is i mpractical in current communication net-work,especiall… 相似文献
14.
15.
由于现代化战场环境动态多变、作战实时性高,针对当前防空作战中武器目标分配(weapon target assignment, WTA)约束多且复杂、传统建模无法真实反映战争过程、模型可信度不高等问题,提出一种在分布式约束优化问题(distributed constraint optimization problem, DCOP)背景下,基于多智能体系统(multi-Agent system, MAS)理论的武器目标优化分配模型,并利用改进的加速梯度下降(accelerated gradient descent, AGD)算法进行求解。通过实验证明了该算法具有良好的收敛性和低复杂度,能够适应现代化防空作战的需求,满足大规模寻优问题的需求,高效解决多智能体目标优化分配问题。 相似文献
16.
In evolutionary games, it becomes more difficult to choose optimal strategies for players because of incomplete information and bounded rationality. For bounded rational players, how to maximize the expected sum of payoffs by learning and changing strategies is an important question in evolutionary game theory. Reinforcement learning does not need a model of its environment and can be used online, it is well-suited for problems with incomplete and uncertain information. Evolutionary game theory is the subject about the decision problems of multiagent with incomplete information. In this article, reinforcement learning is introduced in evolutionary games, multiagent reinforcement learning model is constructed, and the learning algorithm is presented based on Q-learning. The results of simulation experiments show that the multiagent reinforcement learning model can be applied successfully in evolutionary games for finding the optimal strategies. 相似文献
17.
在多功能雷达对抗领域, 目前基于强化学习理论的认知干扰决策方法难以满足雷达对抗高实时性要求。对此, 将异步优势行动者-评论家(asynchronous advantage actor-critic, A3C)算法引入到认知干扰决策领域, 设计了包括干扰机模型、环境模型(目标方多功能雷达)以及交互机制的认知干扰决策整体框架, 制定了干扰决策流程, 干扰机模型利用异步多线程方式与环境模型进行交互训练。仿真实验表明, 在扩充雷达任务转换关系表的基础上, 所提方法与基于深度Q网络(deep Q network, DQN)的认知干扰决策系列方法相比, 极大地提高了时间效率, 平均决策时间降低70%以上, 并且在决策准确度上有着明显优势, 表明所提方法能够为多功能雷达对抗决策提供更有力的技术支撑。 相似文献
18.
随着战争复杂性的不断提升,目标排序模型必须能够从体系的角度出发,对战场中的异质目标进行综合排序,并满足动态、对抗、可进化的要求.首先基于相依网络理论,从对抗的角度出发,综合考虑敌我双方的能力构建目标体系;然后,提出两阶段的目标排序算法,实现了对作用于不同空间的异质类目标的动态综合排序;最后,设计面向历史对抗数据的目标体系权值调整算法,确保了目标排序模型的适应性.通过在某战役级兵棋系统进行实验并与人类指挥员的经验数据对比,验证了所提出模型的有效性. 相似文献
19.
军用车辆器材是维护车辆和保持我军车辆运输能力的重要资源之一。采用全军联勤、军地联供的新保障体制 ,对汽车部队实施高效益的器材保障 ,是高技术战争对车辆器材保障的必然要求。本文运用系统动力学原理 ,对该体制进行了初步的仿真研究 ,研究结果表明 ,新保障体制能更好地适应部队的实际情况和高技术战争的要求. 相似文献