首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 484 毫秒
1.
针对固定时间下的两航天器三维空间追逃问题,采用协同进化算法将复杂的双边最优规划问题简化成对追逃过程中纳什均衡点的搜索,进而得出追逃双方的最优对抗策略及解算方法。考虑在保证算法计算精度的前提下缩短计算时间,将对策模型进行简化处理,以航天器推力指向角为控制量对协同进化算法进行编码设计,利用B样条基函数对编码进行逼近拟合。两航天器均为连续小推力作用,以二者的末端相对距离作为支付函数,逃逸器希望支付最大,追踪器希望支付最小,并依此建立共享适应度函数。所提方法中对协同算子进行改进设计,提高算法空间搜索能力,并采用精英保留策略提高算法的收敛速度。仿真算例得到追逃双方的最优控制策略及相应的追逃轨迹,表明所提方法的能够解决此类航天器追逃问题。  相似文献   

2.
对手建模作为多智能体博弈对抗的关键技术,是一种典型的智能体认知行为建模方法。介绍了多智能体博弈对抗几类典型模型、非平稳问题和元博弈相关理论;梳理总结对手建模方法,归纳了对手建模前沿理论,并对其应用前景及面对的挑战进行分析。基于元博弈理论,构建了一个包括对手策略识别与生成、对手策略空间重构和对手利用共三个模块的通用对手建模框架。期望为多智能体博弈对抗对手建模方面的理论与方法研究提供有价值的参考。  相似文献   

3.
针对导弹实时滚动追逃博弈对抗双方制导律求解问题,设置了若干组对抗双方初始状态,采用分解正交配置法分别离线求解双边开环最优控制,并组成神经网络训练数据集。基于数据集将所有短周期初始和终止时刻对抗双方的状态和控制变量作为输入和输出,采用反向传播(back propagation,BP)算法训练神经网络。然后分别在简单、复杂和不确定环境下,基于滚动时域优化框架使用BP神经网络估计短优化周期内双边开环最优控制,反馈更新对抗双方状态并重复上述过程,进而实时滚动求解导弹追逃博弈双边闭环最优控制。最后将上述方法和直接法得到的优化结果进行比较,捕捉点位置和博弈时间最大误差分别为0.554%和0.097%,两种方法的优化结果吻合较好。同时本文方法计算耗时明显下降,有效提高了导弹滚动追逃博弈制导律求解的实时性。  相似文献   

4.
针对现有研究中无人作战飞机(unmanned combat air vehicle, UCAV)近距逃逸机动的自适应性不足和战术性匮乏问题, 提出一种将模糊专家系统与双策略竞争的可选外部存档差分进化算法(external archiving differential evolution algorithm with dual strategy competition, DSC-JADE)相结合的逃逸机动决策算法。通过对战术知识的学习, 建立模糊专家系统, 将逃逸决策过程通过滚动时域划分为离散片段, 根据模糊专家系统决策得到机动动作, 在其控制量对应的可行域内, 采用改进差分进化算法(improved differential evolution, IDE)进行寻优得到最优控制量, 完成逃逸机动决策。在UCAV处于劣势的初始条件下进行仿真验证, 证明DSC-JADE算法相较原始差分进化以及其他传统群智能算法搜索能力更强,采用专家系统相较不采用专家系统逃逸决策能力更优。  相似文献   

5.
针对多层网络演化博弈,采用半张量积方法,遵循短视最优响应策略更新原则,将博弈动态过程进行公式化并研究其策略最优问题。首先,通过半张量积将多层网络演化博弈转化成代数公式的形式,建立相应的转化算法;其次,基于该公式,讨论了博弈的动态行为;最后,通过增加伪玩家到博弈中来研究策略最优问题,目的是设计自由控制序列来最大化伪玩家的平均收益,从而得到最优控制序列。并举例验证了研究结果的有效性。  相似文献   

6.
为提高反射面天线电性能,基于机电耦合理论,以增益和第一副瓣为综合控制目标,建立智能反射面天线形状最优控制模型。模型考虑结构强度和作动器性态约束,将作动电压作为被控变量, 通过机电耦合模型将电性能表示为作动电压的函数。以某7.3 m反射面天线为研究对象,同时考虑自重与温度载荷,分别应用所提方法与传统形状最优控制方法进行控制,其中温度载荷由77个温度传感器实测获取。结果表明,基于机电耦合理论的形状最优控制模型在改善天线的电性能方面更加有效。  相似文献   

7.
企业环境行为监管中,政府、排污企业、公众等多主体的动态交互和信息不对称导致环境治理的复杂性,本文考虑环境污染治理过程中的信息不对称,利用演化博弈理论建立政府、排污企业、公众参与的三方博弈模型。并利用系统动力学探讨演化博弈模型,动态模拟分析利益相关者互动的稳定性,同时确定均衡解的方案。仿真结果表明,三个利益相关者的策略选择反复波动,这表明演化稳定策略不会存在于利益相关者之间。因此,动态惩罚控制方法和优化的动态奖惩控制方法被提出来控制波动,然后再次进行模拟。仿真结果表明,动态惩罚控制方法能有效地抑制波动,使利益相关者的相互作用更稳定。此外,优化的动态奖惩控制方法,不仅可以有效地抑制波动,同时也得到了一个理想的演化稳定策略,其中排污企业可以选择对污染物处理作为自己的最优策略。本文的分析和结果可为环境治理提供相应的参考。  相似文献   

8.
云计算理论中动态资源分配优化模型研究有待完善,本文提出处理动态资源分配优化问题的群智能处理模型.通过建立博弈量 子场数学模型,探讨基于价格机制的博弈理论,进一步通过发掘群智能原型中群体行为,并发现其内在的自组织行为和合作行为 机制,从而研究模型的自治性、平衡态和稳定性.最后针对宽带网络的带宽分配问题应用实例,定义了需求偏差函数,采用需求 满意度大以及需求偏差小的优化目标验证了模型性能,研究结果表明:本文基于价格机制博弈策略的模型是有效和可行的,不仅可以满足供需双方的利益,而且提高了资源的利用率.  相似文献   

9.
针对歼击机机动规避空空导弹问题,建立了一种有导弹制导动力学滞后的空空导弹飞机的追逃运动学二维模型,研究了飞机机动时机、机动方式对主动寻的空空导弹过载需求和脱靶量的影响,并根据机动脱靶量仿真了飞机机动逃逸概率,得到了机动可大幅度提高飞机逃逸概率,开关机动优于圆机动,以及机动周期越短规避效果越好的结论,解决了飞机机动规避空空导弹的定量评价问题。  相似文献   

10.
本文研究一国碳排放量的最优控制问题. 假设这个国家的总碳排放量由国内生产总值(GDP)和人口决定,而GDP满足几何布朗运动模型,国内人口数量满足Logistic模型. 国家采取一些策略降低国内的碳排放量,这些措施也会产生相应的成本. 这个国家需要在降低碳排放量的同时,使得控制过程中的总费用最小. 利用随机控制理论的相关结论,可以对这一问题进行建模,并得到相应的Hamilton-Jacobi-Bellman(HJB)方程. 由此得出的半线性方程可以通过Cole-Hopf变换变为线性并得出显式解,从而得出相应的最小成本和最优控制策略的表达式. 我们对解进行数值计算,得出了值函数与不同参数的关系图.  相似文献   

11.
未来的来袭导弹可能具备较强的机动性,其弹道不可预测,针对拦截弹追击此类目标的追逃问题,基于微分对策(differential-game, DG)理论建立追逃博弈模型并给出求解方法。模型在分析两者相对运动的基础上,考虑地球重力和自转的影响,以推力角为控制变量,离地高度、速度和经度角为状态变量,建立微分方程组。然后将追逃DG模型转化为单边最优对策问题;并给出改进的高精度五阶Gauss-Lobatto多项式配点法来近似状态变量对时间的导数,将微分方程组转换为代数约束,降低非线性规划问题复杂程度。最后给出了本文研究的仿真实例。  相似文献   

12.
本文研究了有终端约束的拦截任意机动目标的模糊导引律设计问题。应用模糊T-S线性模型,来逼近拦截几何的非线性模型,从线性系统的角度,利用RH控制方法和伴随技术,得到了一种新的鲁棒模糊导引律。这种方法能够以一个模糊T-S线性模型,来处理目标一定范围内的机动,而通过一系列模型的在线切换,来处理目标大范围内的机动。这种导引律具有快速、简便的特点和宽的初始阵位适用范围。仿真结果表明,这种导引律能够拦截任意机动的目标,获得较高的命中精度。  相似文献   

13.
研究和分析了随机产出下两级供应链供需双方的三种博弈模型:销售商主导的Stackelberg博弈模型、生产商主导的Stackelberg博弈模型和纳什博弈模型,得到了在这3种博弈模型下的最优订购量和最优计划生产量,通过研究发现:当销售商在供应链决策中占主导地位时的最优订购量和最优计划生产量都大于其他2种情况下的对应值.最后,通过数值计算比较了在随机产出服从均匀分布时,这3种博弈下供需双方的最优策略及相应利润,并得出了选择销售商占主导地位的Stackelberg博弈行为将有利于商家获取更多利润的重要结论.  相似文献   

14.
Li  Yapeng  Deng  Ye  Xiao  Yu  Wu  Jun 《系统科学与复杂性》2019,32(6):1630-1640
To investigate the attack and defense strategies in complex networks, the authors propose a two-player zero-sum static game model with complete information which considers attack and defense strategies simultaneously. The authors assume that both the attacker and defender have two typical strategies: Targeted strategy and random strategy. The authors explore the Nash equilibriums of the attacker-defender game and demonstrate that when the attacker's attack resources are not so significantly abundant as the defender's resources, there exists a pure-strategy Nash equilibrium in both model networks and real-world networks, in which the defender protects the hub targets with large degrees preferentially, while the attacker prefers selecting the targets randomly. When the attack resources are much higher than defense resources, both the attacker and the defender adopt the targeted strategy in equilibriums. This paper provides a new theoretical framework for the study of attack and defense strategies in complex networks.  相似文献   

15.
鞍点均衡策略在动态投入产出系统中的应用研究   总被引:1,自引:0,他引:1  
基于W·Leontief提出的动态投入产出模型,讨论了其连续型的最优策略设计问题。利用博弈论的思想,把动态投入产出系统抽象为一个鞍点均衡博弈模型,运用鞍点均衡策略设计出求解动态投入产出问题的新方法,为宏观经济决策提供依据。最后的数值仿真示例证明了此方法的有效性。  相似文献   

16.
阐述了现代战机导引系统的功能、结构与工作方式。对追踪导引建模之后,假设目标机动轨迹可知,应用最优控制理论,通过巧妙的数学推导和数值计算,研究了追踪时间最优的导引律。针对具体工程实现时理论设计求解中数值计算误差的客观存在,又应用预测控制分段计算、滚动优化的思想,对最优导引律作了进一步改进,获得了更为可行实用的优化导引律。仿真研究表明,所设计的优化导引律较各种比例导引律性能更优,捕获目标的时间更短,消耗的能量更少,并能成功应用于载机导引,为新一代战机导引系统的研制与引进飞机的国产化提供了理论参考。  相似文献   

17.
针对无人战机(unmanned combat air vehicles,UCAV)(目标)发射防御弹对来袭攻击弹以一定拦截角度进行拦截的问题,假设目标和防御弹协同飞行且其之间只能进行单向信息传输,在来袭弹采用增强比例导引律的前提下,建立了防御弹信息单向传输和目标信息单向传输两种模式下的防御弹攻击弹视线角非线性模型。考虑防御弹脱靶量要求、拦截角度约束和防御弹(或目标)的控制能量因素,建立了性能指标函数,采用最优控制理论,分别设计了能够使防御弹以指定拦截角度拦截攻击弹的目标单向协同制导律和防御弹单向协同制导律。仿真结果表明,在两种信息单向传输模式下,通过目标与防御弹的协同,防御弹均可以指定拦截角拦截攻击弹;与具有拦截角度约束的非协同制导律相比,单向协同制导律的控制能量更小。  相似文献   

18.
针对工业无线传感器网络通信链路上存在的节点安全问题, 提出一种可抵御节点攻击的多层Stackelberg博弈模型。选择最佳协作干扰节点协同抵御全双工攻击节点, 将合法节点与攻击节点之间的对抗关系以及合法节点间的内部协作关系建模成多层Stackelberg博弈模型, 分析博弈模型的闭式均衡解; 设计分阶最优响应迭代算法求解Stackelberg博弈均衡。仿真结果表明, 所提的最佳协同干扰节点选择方案对攻击节点具有较好的干扰效果且节省能耗; 与其他功率控制模型相比, 所提模型可有效增加协作干扰节点的收益,提高协作的积极性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号