首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
在分析不完全信息计算机网络对抗问题特点基础上,运用马尔可夫决策描述网络状态转移过程,用区间数刻画不确定参数,以折扣总回报值为目标函数,提出计算机网络对抗行动鲁棒博弈模型.采用凸分析理论对计算机网络对抗鲁棒博弈模型进行分析,得到网络攻防双方的收益函数为等度、连续凸函数,攻防双方存在均衡策略且为一个压缩映射.通过算例分析,验证方法的可行性和有效性.  相似文献   

2.
情报提供及时、完整、准确的对抗态势,使得作战的指挥决策者能顺利完成决策任务.情报生成是保证情报质量的关键,现有计算机网络对抗缺少独立的情报生成系统.基于着色Petri网,为计算机网络对抗的战术情报提出一种生成模型.明确计算机网络对抗的作用对象及情报外延,形式地定义情报生成活动及过程,在此基础上建立战术情报生成的CPN模型.该模型通过CPN Tool2.2进行仿真和分析,验证了该模型提供的情报生成过程的计算可行性和有效性,为相应的软件系统设计提供依据.  相似文献   

3.
将Lanchester方程应用于舰炮对海攻击作战 ,给出了一个平均意义下选择最优舰炮攻击阵位的数学模型。该模型考虑了整个作战动态过程中双方在任意时刻受损的情况及剩余的射击能力。模型计算结果可为作战决策提供参考。  相似文献   

4.
对抗行为建模是很多类军事竞争问题研究的关键.现有研究主要面向目标域,而现实中很多对抗问题发生在路网之上.对此,结合对抗行为的网络流表示,提出了一种塞于非合作博弈的路网对抗博弈建模框架,并给出了一个问题实例—网络逃避阻断博弈.仿真试验表明新的双启发式求解算法表现优于原始线性求解算法;基于现实路网的数据实验进一步验证了算法...  相似文献   

5.
针对当前从体系视角对防空体系进行态势分析的模型较为缺乏, 且模型结果不易于指挥员分析理解的问题, 提出了基于生成对抗网络的防空体系态势辅助分析模型。首先, 通过图形化的方法对防空体系态势信息以及作战能力进行描述, 便于人类指挥员更好的理解。然后, 利用生成对抗网络模拟人类指挥员态势分析的过程, 从浅层态势特征推理得到防空体系能力图。最后, 利用多个指标对各类模型的结果进行对比。实验结果表明, 所提模型可以从体系视角进行分析, 得到防空体系能力图, 生成图像的准确率较其他模型至少提高34.1%。  相似文献   

6.
为了提高空天地一体化车载网络(space-air-ground integrated vehicular networks, SAGVN)内用户的网络服务质量体验, 解决不同网络间相互协同的问题, 提出了面向用户需求的SAGVN任务分配策略。基于用户信号强度、时延、网络费用和带宽需求, 利用效用函数理论和层次分析法(analytic hierarchy process, AHP), 构建用户需求和满意度描述框架。将网络任务分配过程抽象为半马尔可夫决策过程(semi Markov decision process, SMDP), 根据用户需求和网络状态, 利用价值迭代算法获得整体用户满意度最大的网络任务分配策略, 利用Q-learning算法得到近似最优策略。实验表明, 相较于传统策略, 所提策略整体用户满意度提高超过30%;在网络拥塞的环境下, 可以有效降低对网络服务需求迫切用户服务请求的拒绝率。  相似文献   

7.
无人集群博弈对抗是一种新兴的作战样式,在智能化战争扮演着至关重要的作用,其核心是自主生成博弈对抗决策序列,为集群“赋能”。分析了无人集群博弈对抗系统仿真验证的进展;从基于专家系统和博弈论的技术、基于群体智能和优化理论的技术,以及基于神经网络和强化学习的技术三个方面论述了自主决策关键技术,以及课题组在自主决策上开展的相关工作;提出了无人集群博弈对抗的发展方向。  相似文献   

8.
战争设计工程中对抗决策网络与黑板机制相结合的方法   总被引:1,自引:0,他引:1  
战争设计工程是一种面向战争复杂性的分析与设计战争的方法。分析战争设计工程中异质专家研讨的需要,提出基于对抗决策网络与黑板机制有机结合的研讨方法。首先借鉴了黑板机制灵活集成异质专家智慧定性推理的能力,然后将作战效果与对抗性引入到动态贝叶斯网络中,提出对抗决策网络支持对抗策略的定量推理,根据对抗决策网络与黑板机制相关要素的相容性将二者有机结合,提出对抗决策网络黑板机制,并进一步分析对抗决策网络黑板的体系结构。最后以一个简例说明异质专家能够基于对抗决策网络黑板机制展开研讨,对战争系统进行分析与设计。  相似文献   

9.
群决策问题的REM集结模型   总被引:24,自引:0,他引:24  
从相对熵的概念出发提出了求解群决策中由个体偏好评判值集结群体偏好评判值的新思路,建立了能够集结不同专家偏好评判值为群体一致或妥协偏好的相对熵(REM)模型,并给出了相对熵算法有效性的理论证明及算例  相似文献   

10.
为使5G混合专网结构的2种用户能获得最优计算卸载策略,将2种用户竞争移动边缘计算(mobile edge computing,MEC)服务器资源的问题建模成Stackelberg博弈,并分别讨论了完全信息博弈和不完全信息博弈下的策略。完全信息博弈下,存在唯一纳什均衡解;不完全信息博弈下,将环境建模为部分可观测的马尔可夫决策过程(partially observable Markov decision process,POMDP),并提出一种基于二阶段深度强化学习(two-stage deep reinforcement learning,TSDRL)的最优卸载策略。仿真实验表明:该算法相较于D-DRL算法能减少20.81%的时延及3.38%的能耗,有效提高用户QoE(quality of experience)。  相似文献   

11.
刘奇志 《系统工程理论与实践》2011,(Z1):132+135-146,131
在继承传统层次分析/网络分析方法的基础上提出一种新的决策方法——基于有限状态齐次马尔科夫链的网络决策方法MC-ANP.该方法使用有向图定义决策准则及准则之间的支配关系.通过对准则的两两比较量化支配关系,用马氏链的状态转移描述支配关系.该方法突出了准则支配关系的合成过程,提供了两种合成模型(其中积合成模型可以彻底解决传统层次分析中出现的逆序问题),指出传统网络分析中无条件使用Cesaro平均极限求解存在的问题.新方法将决策问题分为两类:有方案的决策问题,解是对方案的排序,求解过程就是求马氏链状态转移概率方阵的属于特征根1的特定的左特征向量;无方案决策问题,解是对准则的排序,解是马氏链状态转移概率方阵的属于特征根1的右特征向量.  相似文献   

12.
公交网络车费设定问题的Stackelberg博弈模型   总被引:6,自引:2,他引:4  
对城市公交网络系统车费的合理设定问题进行了研究分析,考虑到乘客对公交收费变动会作出相应的反应,从而改变网络上乘客的流量分布,运用Sackelberg博弈理论,将这一问题描述为一个两级数学规则问题,在一定的公交网络收费结构下,乘客在网络上的流量分布可由随机用户平衡分配模型进行估计,鉴于两级规划问题的非凸性,提出了基于灵敏度分析的启发式算法,最后,给出一个仿真算例说明本文提出的模型和算法的合理性。  相似文献   

13.
针对小样本集构建稀疏马尔可夫网络计算量大和求解精度不高的问题,提出一种基于高斯噪声模型的迭代噪声消减(iterative noise reduction,INR)算法。该算法首先利用回归误差的高斯特性筛选相关变量,然后通过boosting方法的自回归更新策略逐步改进学习能力,最后采用赤池信息准则(Akaike information criterion,AIC)避免出现过拟合。此外,给出了自回归更新公式,实现了可控的学习错误率并分析了计算复杂度。实验结果表明,INR能有效构建高维稀疏网络,在学习效率和精度方面具有明显优势。  相似文献   

14.
部分可观测马尔可夫决策过程(POMDP)是马尔可夫决策过程(MDP)的扩展,它允许系统的状态信息部分可知。但POMDP的可能应用大部分没有实现,这主要是因为缺乏有效的算法。POMDP的算法分为近似算法和精确算法,精确算法是构造近似算法的基础。介绍了POMDP模型后,对离散时间、有限状态集的POMDP精确算法和近似算法进行了综述,分析了造成POMDP难以求解的主要原因,提出了进一步的研究方向。  相似文献   

15.
对广泛存在的一类事件驱动的平均费用型马尔可夫决策问题,通过分析其模型特征,研究了一种简单的增强型学习算法,不必将事件扩充为系统状态,而只对原始状态的值函数进行学习,减少了计算量和数据存储量。将算法应用于M/M/1排队系统的接纳控制问题,计算机仿真结果表明,算法优于通常的增强型学习和动态规划方法,验证了算法的有效性。  相似文献   

16.
针对定量分析战斗平台火力运用问题,根据该过程所具有的马尔可夫性特点,将其描述为状态离散、时间离散的马尔可夫链,由此研究了一对一格斗、仓促突破战斗、对密集目标群射击等情况下的马尔可夫链模型。在建立系统状态空间的基础上,将战斗平台火力运用行动转化为系统状态间的转移,解决了弹药消耗量预计、作战结果预测等问题。应用示例表明:该模型体现了战斗平台火力运用实际特点,且运算简便、实用。  相似文献   

17.
This paper investigates the feedback control of hidden Markov process(HMP) in the face of loss of some observation processes.The control action facilitates or impedes some particular transitions from an inferred current state in the attempt to maximize the probability that the HMP is driven to a desirable absorbing state.This control problem is motivated by the need for judicious resource allocation to win an air operation involving two opposing forces.The effectiveness of a receding horizon control scheme based on the inferred discrete state is examined.Tolerance to loss of sensors that help determine the state of the air operation is achieved through a decentralized scheme that estimates a continuous state from measurements of linear models with additive noise.The discrete state of the HMP is identified using three well-known detection schemes.The sub-optimal control policy based on the detected state is implemented on-line in a closed-loop,where the air operation is simulated as a stochastic process with SimEvents,and the measurement process is simulated for a range of single sensor loss rates.  相似文献   

18.
网络体系(system of system, SoS)的效能评估是SoS建设和分析的重点问题。传统功能依赖网络分析(functional dependency network analysis, FDNA)方法可以展示SoS“松散耦合”特性, 但缺乏对组件系统的运行独立性、效能衰减性、拓扑规律性等特征的关注。针对此, 在考虑多态问题的基础上, 通过Markov过程分析, 推导组件系统的自主效能衰减函数与系数, 改进了传统方法中的固定参数, 求得节点的动态效能值。在界定“相关SoS”概念的基础上, 计算组件系统可靠度的重要度, 识别关键节点, 构建网络SoS效能评估函数。以五节点航天SoS为例, 演示评估过程并验证了方法的可行性。  相似文献   

19.
基于模糊马尔科夫理论的机动智能体决策模型   总被引:2,自引:1,他引:1  
针对机动作战仿真背景,运用智能体理论研究战术机动智能体的最优机动决策问题。对传统的马尔科夫决策模型进行了扩展,通过定义攻击威胁下机动智能体的模糊状态空间、模糊状态转移规律和决策收益,建立了模糊战术机动决策模型,较好地描述了实际作战决策中的模糊认知、分析、判断等信息处理过程。通过引入强化学习手段,提出融合指挥员先验信息的Q学习算法和状态动态分类识别算法,对状态转移规律不易确定时模型的求解进行了研究;仿真实验验证了模型和算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号