首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
基于Q-network强化学习的超视距空战机动决策   总被引:3,自引:0,他引:3       下载免费PDF全文
考虑到空空导弹对空战胜负的重要影响,针对空战态势状态特征连续、多维的情况以及传统方法缺乏对空战对抗中敌方策略的考虑,将强化学习应用到1vs1超视距空战机动决策。首先,建立了同时为对抗双方进行机动决策的强化学习框架,提出ε-纳什均衡策略来选取机动动作,并通过导弹攻击区优势函数来修正奖赏函数;其次,基于记忆库和目标网络训练Q-network,形成超视距空战机动决策的"价值网络";最后,设计了Q-network强化学习决策模型,并将机动决策过程分为了学习阶段与实战阶段。仿真结果表明:智能体可以感知空战的态势并作出合理的超视距空战机动决策。  相似文献   

2.
敌机战术机动动作的在线识别可为空战态势感知、任务规划和辅助决策提供重要参考信息.针对雷达数据不能提供敌机姿态信息,导致战术机动动作难以直接描述的问题,提出了一种基于空战机动动作元的两级识别方法.首先分析了雷达传感器提供的特征信息;其次根据战术动作的航迹曲线,将空战战术动作分解为11种基本的机动动作元,降低了动作描述的复杂度;然后采用随机森林和支持向量机设计了两级识别方法,层级1利用航迹参数识别机动动作元,层级2根据动作元序列和运动参数识别战术动作.通过对仿真飞行数据进行验证,表明机动动作元能有效描述典型机动动作,提出的方法能够实现敌机战术机动的准确在线识别.   相似文献   

3.
基于蒙特卡洛树搜索方法的空战机动决策   总被引:2,自引:0,他引:2       下载免费PDF全文
针对空战中双方的机动决策问题,考虑角度、距离、速度变化以及高度优势函数,以赢取最大空战优势期望为目标,建立了空战双方机动决策模型,并引入蒙特卡洛树搜索方法进行求解,搜索策略采取极大极小搜索算法。针对双机对抗,通过仿真给出空战态势及空战优势变化曲线,结果表明:我机在整个空战过程中绝大部分是处于优势地位的,验证了使用蒙特卡洛树搜索方法进行空战机动决策的可行性,同时对算法的实时性进行了仿真,计算机动动作所用时间众数位于50~100ms区间内,达到了实时性要求。  相似文献   

4.
动态行为评估是一个热门的研究课题。本文以飞行员行为评估为例,研究了一种"空战平均时间"+"占优态势"+"空战可信性"的动态行为评估方法。本方法的特色是:1)引入了"机动"到"机动"的推理,即,根据当前进行的机动推出下一步的机动;2)使用多线程模拟,即,每个飞行员用一个线程来模拟,每个线程能够独立地进行飞行决策、飞行动力学系统解算和战术机动;3)加权的空战可信性计算公式,即,在计算空战可信性时考虑到了作战双方各自所处的"占优态势"次数和"均等态势"次数以及各自的权重。整个评估方法易于实现、效率高、可行性强。实验结果表明:提出的动态行为评估方法是一种有效评估方法。  相似文献   

5.
针对超视距空战机动决策问题,提出基于战术机动组合的超视距空战决策模型。首先,利用参数化语言将超视距空战机动描述为两种典型形式,作为超视距空战战术的基本战术动作。其次,引入层次任务规划网络(HTN)模型,利用空空导弹攻击区描述空战态势,构建带参数的空战HTN模型。最后,将机动时间、可发射距离、可发射时间作为目标函数,构建多目标优化模型,采用飞蛾扑火算法对HTN网络参数进行优化求解。仿真实验表明,飞蛾扑火算法能够快速解算当前态势下的最优参数,所得到的空战战术机动序列能够达到战术目的。该算法模型可以为飞行员提供辅助决策,也为研究智能超视距空战提供了新的思路。  相似文献   

6.
现有的无人机态势评估方法没有考虑复杂外界环境对决策者的影响,并且通常只能得到评估的排序结果,决策者需要在短时间内进行决策,常出现误判或错失打击窗口期.针对该问题,提出一种基于累积前景理论的三支决策模型.首先,通过直觉模糊接近于理想值的排序方法求取目标的条件概率,得到态势评估结果;之后基于累积前景理论对无人机获取的直觉模糊态势信息进行计算,得到每个目标执行不同动作时对应的累积前景价值;最后,基于累积前景价值最大化的原则,推导出新的三支决策规则,对态势评估结果进行三支划分.实验分析表明:该方法不仅得到了目标威胁排序,而且对目标威胁等级进行客观分类;同时在评估过程中考虑决策者的心理,得到符合决策者特质的目标威胁评估结果,为复杂多变的空战提供一种合理的决策支持.  相似文献   

7.
近距空战中环境复杂、格斗态势高速变化,基于对策理论的方法因数据迭代量大而不能满足实时性要求,基于数据驱动的方法存在训练时间长、执行效率低的问题。对此,提出了一种基于深度强化学习算法的UCAV近距空战机动决策方法。首先,在UCAV三自由度模型的基础上构建飞行驱动模块,形成状态转移更新机制;然后在近端策略优化算法的基础上加入Ornstein-Uhlenbeck随机噪声以提高UCAV对未知状态空间的探索能力,结合长短时记忆网络(LSTM)增强对序列样本数据的学习能力,提升算法的训练效率和效果。最后通过设计3组近距空战仿真实验,并与PPO算法作性能对比,验证所提方法的有效性和优越性。  相似文献   

8.
为解决评估过程中评估指标体系权重分配不合理和空战数据不确定的问题,提出基于博弈论和区间云模型进行非完备空战决策效能评估的研究方法。针对空战攻防决策,构建评估指标体系,基于博弈论合理调整主客观权重获得指标的综合权重值。然后,对评估中出现的随机性和模糊性问题,研究区间云模型方法,通过区间云发生器确定非完备空战决策效能优劣。最后,通过仿真验证了所提方法的可行性和有效性,为解决非完备信息下的空战决策效能评估问题提供了技术支撑。  相似文献   

9.
为解决针对空战决策展开评估过程中出现的复杂性和不确定性问题,构建了面向空战决策的评估指标集 并提出以一种基于云模型的云重心法和一致性赋权法相结合的闭环评估法。该方案首先对基础数据进行归一 化处理,并建立相对应的空战决策云模型,再根据指标相似性和一致性构建指标集权重,最后选取合适阈值判 断评估有效性完成评估方案的闭环反馈。仿真实例表明,该方案确保了评估的准确性和有效性,避免了传统方 法出现的随机性问题,真实反映了空战中决策的好坏。  相似文献   

10.
基于集对分析的预警机指挥多机编队空战态势评估   总被引:1,自引:0,他引:1       下载免费PDF全文
多机编队空战态势评估是预警机指挥多机群协同空战战术决策的重要组成部分。分析了预警机指挥下的多机编队空战态势评估。结合态势评估的常用方法建立了一种综合距离优势、角度威胁因子、速度威胁因子的集对分析的态势评估模型。该方法在既定编队间进行态势评估不仅考虑双方的各个态势因素,还考虑敌方友机编队、我方友机编队等因素对态势评估结果的影响。态势评估的组合方式表明态势评定是在敌我双方所有的编队中进行的,仿真结果表明:集对分析中势的概念可以直观反映空中态势的优劣,对不确定值i的分析全面反映了态势变化。  相似文献   

11.
针对近距空战下的自主机动反追击问题,建立了无人机反追击马尔科夫(Markov)决策过程模型;在此基础上,提出了一种采用深度强化学习的无人机反追击自主机动决策方法.新方法基于经验回放区重构,改进了双延迟深度确定性策略梯度(TD3)算法,通过拟合策略函数与状态动作值函数,生成最优策略网络.仿真实验表明,在随机初始位置/姿态...  相似文献   

12.
基于多Agent的指挥引导智能决策模型研究   总被引:3,自引:1,他引:2       下载免费PDF全文
以多机协同作战为背景,以拟制协同作战方案为目的,将分布式人工智能理论技术引入到多机协同作战智能辅助决策,构建了基于多Agent的智能决策指挥系统框架,给出了该系统的Agent组成,定义并说明了各Agent的功能以及相互关系、信息运行流程,并分析了该系统的辅助决策过程。  相似文献   

13.
针对空战中无人作战飞机战术决策自主化问题,提出了基于案例推理(CBR)和规则推理(RBR)的战术决策方法。在剖析战术决策案例特征的基础上,设计了一种基于框架结构的案例表示方法,并引入结构相似度和云模型理论,以改进传统的最近邻检索算法。最后,利用基于案例推理和规则推理设计的战术决策GUI界面,能够快速地从库中检索出与当前空战态势最匹配的战术决策源案例,证明了该方法具有较好的有效性。  相似文献   

14.
基于效用理论的有限理性半自治Agent决策方法   总被引:1,自引:0,他引:1  
为了更加贴近描述agent的决策过程,发挥基于效用理论的决策较之推理决策具有定量化和客观性的优点,通过建立基于半自治作战agent的战场环境,根据有限理性半自治agent的决策过程特点,结合效用理论给出了一种有效的基于效用理论的半自治agent决策方法,将该方法应用于坦克agent对抗中的目标选择模型实例中,通过对仿真结果的分析,表明了此方法适用于建立丰自治agent的决策模型。  相似文献   

15.
针对未来空战中新的作战样式和作战对象,研究了电子支援下截击空战仿真的关键问题。以歼击机、无人机和电子战飞机组成的空中联合编队为主要研究对象。采用面向对象建模技术,利用UML的用例图、类图研究了截击空战的静态功能结构,通过序列图、活动图建立了截击空战的交互模型和活动转换模型,系统地描述了作战流程,重点突出了电子对抗建模,最后实现了截击空战仿真系统。仿真实验证明:该系统能为航空电子对抗系统作战效能评估提供实验平台。  相似文献   

16.
决策影响图是决策分析的一种新的图形表征求解方法,它用无回路的有向图表征决策变量、随机变量和目标函数之间的相关关系,并进行推理分析、信息分析和灵敏度分析等.本文运用影响图分析法研究设备可靠性分析问题.  相似文献   

17.
以辅助基层作战部队进行信息化管理和科学决策为出发点,借助决策支持系统和管理信息系统的基本理论和方法,提出了基层作战部队信息化管理及辅助决策系统的总体结构。  相似文献   

18.
歼击机空战过程通常表现为搜索、接敌、攻击和退出战斗等阶段,空战各阶段活动有不同的目的、内容和方法,但其效果都对空战的胜负具有重要影响。作战双方都希望选择一个最合适的时机发射(射击),过早或过晚都对已方不利,先对一对一空战接敌到击阶段作出定量与定性分析,再对二对二空战决策模型进行了讨论。  相似文献   

19.
判决反馈常数模盲均衡算法(CMADFE),在均衡的起始阶段,由于眼图未睁开,容易引起判决器的误判,导致收敛速度慢。为了减小误判的影响,在迭代初期把判决信号加权后送入反馈滤波器中,当均衡一段时间后再把判决信号不需加权直接送入反馈滤波器,从而得到加权的CMADFE算法。计算机仿真表明,加权的CMADFE算法提高了收敛速度,且均方误差亦有所减小。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号