首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 156 毫秒
1.
针对对抗及不确定环境下的网络信息体系建设方案优选问题,考虑经典博弈论中理性和共同知识假设失效的局限,提出了基于Bayesian Stackelberg的多阶段博弈模型。首先分析网络信息体系建设方案优选需求,给出3个基本假设;在此基础上,构建反映各阶段参与人信念的博弈子情景,集结子情景形成全时域情景,并分别给出情景的策略集及支付函数;分析全时域情景的纳什均衡,预测对手可能的均衡策略;最后,集结全时域情景形成全局情景,在风险可控范围内选择全局情景中期望支付较大策略,作为较优体系方案。通过算例分析检验了该方法中己方最坏选择是“综合均衡策略”,且在风险可控范围内最终策略将严格优于该策略。  相似文献   

2.
基于博弈网的军事决策方法   总被引:1,自引:0,他引:1  
作为一种不确定性对抗环境下的决策, 军事决策方法必须有效应对决策环境的不确定性及决策者的有限理性.基于超博弈思想, 提出一种描述不确定性环境下军事决策的新模型--博弈网. 基于博弈网的军事决策方法可以有效应对决策决策过程中的不确定性及决策者的有限理性. 求解博弈网的过程中, 将均衡理论和期望效用理论相结合, 确定对方综合均衡策略, 在可承受的风险范围内可选择至少不劣于纳什均衡的可执行策略. 1973年中东战争和"沙漠风暴"行动两个实例分析表明博弈网及新决策方法在应对不确定性方面具有可行性, 有效性和实用性.  相似文献   

3.
恐怖袭击事件中博弈双方高度不对称和存在认知差异,误对策方法提供了合适的分析框架.本文运用误对策分析方法剖析了恐怖袭击事件中政府反恐力量与恐怖分子的认知差异,并分析了不同情境下策略冲突的平衡结局.由于双方认知偏差可能导致不存在纯策略纳什均衡,而混合均衡进一步加大了策略的不确定性,安全策略采取"安全第一"的原则使决策者避免最大风险,相对于纳什均衡更合适作为存在认知差异的误对策问题的均衡分析方法.在实践操作角度上,恐怖袭击二阶误对策模型的平衡结局为恐怖分子发动的恐怖袭击行动将被挫败,因此提出提高反恐效能的政策建议,即发动社会民众提供反恐情报和预警线索,提高民众反恐意识.  相似文献   

4.
面对着恐怖主义威胁的日益长期化,政府、平民和恐怖分子表现出不同的时间偏好.本文构建了具有不同时间偏好的反恐重复博弈模型.首先构建了政民协同反恐和反恐失利两种反恐情景下的阶段博弈模型.然后,博弈方在重复博弈中的策略设计为分别采取了趋于均衡的随机化策略以及采取趋于偏离的随机化策略,比较了两种随机化策略下不同时间偏好和参与方偏离行为对于博弈支付函数的影响.研究结果表明,首先,随着政府或恐怖分子采取的随机化策略趋于稳定其将注重长期收益,随着政府或恐怖分子采取的策略愈发非理性和不稳定他们的行为将趋于短期化.其次,由于政府、平民和恐怖分子在反恐博弈中接近于零和博弈,因此任何一方采取非均衡的随机化行为都将导致其它两方收益的上升,但是政府和平民之间存在着一损俱损、一荣俱荣的政民协同效应.第三,如果恐怖分子采取了趋于均衡的随机化策略,则政府充分利用恐怖分子的失误实现短期收益最大化.但是,如果恐怖分子采取了趋于偏离的随机化策略,则政府注重制定长期的反恐策略.  相似文献   

5.
消费者偏好不确定下的双寡头企业竞争策略   总被引:2,自引:0,他引:2  
在具有Stackelberg博弈均衡的Hotelling模型中,本文引入消费者偏好不确定性,研究其对企业竞争策略的影响.博弈的均衡结果表明:在消费者偏好不确定下,市场先进入者比后进入者获得更高的市场价格和利润;企业产品的均衡价格、利润、差异性和社会福利都随不确定性的增大而增大;在Stackelberg博弈均衡中获得的市场价格、利润、产品差异性和社会福利都大于在Nash博弈均衡中所获得的结果.  相似文献   

6.
指出公交和轨道交通的均衡发展是多维Stackelberg博弈过程,给出多维Stackelberg博弈和多维Nash均衡的定义,分析公交和轨道交通的博弈效用函数,以及其博弈的阶段性均衡解.实例分析表明:公交和轨道交通的均衡发展是以轨道交通为先导,公交尾随,城市居民参与,交管部门密切配合管理的追求系统最优的多维Stackelberg博弈过程,按照多维Nash均衡解来选择策略向量,公交和轨道交通的服务能获得阶段性全局最优.此研究有利于提高城市公交和轨道交通的服务水平.  相似文献   

7.
军事威慑中试探策略博弈分析   总被引:3,自引:0,他引:3  
在标准两阶段军事威慑博弈基础上构建了带有挑战者试探策略和含有信号传递子博弈的三阶段威慑博弈模型,分析了该博弈的混同均衡和分离均衡,提出了军事威慑博弈中试探策略有效运用的基本条件。  相似文献   

8.
作为无人机空战过程中较大的不确定性因素,作战双方毁伤概率易受外界因素影响,可能在一定范围波动,针对这一问题将鲁棒优化思想引入无人机空战博弈模型中,结合纳什均衡求解的适应度函数的期望和方差,建立了变权重的自适应目标函数,设计了权重的分配方法。在确保策略解可行的同时,提高了毁伤概率变化因素下混合策略的鲁棒性。仿真实验结果表明,与原博弈模型相比,新模型纳什均衡解下的双方博弈收益受参数变化影响较小,可提供更可靠的策略参考。  相似文献   

9.
个体与群体之间的一类博弈问题分析   总被引:7,自引:0,他引:7  
分析个体与群体之间的一类博弈问题,构造一对多博弈模型。其同时具有Stackelberg模型、演化博弈模仿者动态模型的特点:在博弈的第一阶段,有限理性的群体参与者采取模仿者动态行为;在博弈的第二阶段,完全理性的个体参与者根据群体参与者的策略分布,确定自己的反应函数。博弈达到稳定状态后,群体参与者采取演化稳定策略,而个体参与者的风险占优策略将收敛于Nash均衡策略。讨论模型的一些性质:有限理性的群体在模仿过程中存在收益损失;老练的个体参与者存在欺骗行为;在个体参与者完全理性决策的带引下,可以解决多重Nash均衡的选择问题。  相似文献   

10.
公平补偿是房地产征收补偿的核心原则,化解房地产征收补偿极端争议的有效途径是寻找关联主体一致认同的公平均衡.将寻利公平、损失规避和参考依赖三种行为偏好集合于同一分析框架构建的多维公平均衡能有效推动关联主体公平信念判断的一致性转变.房地产征收补偿的TOPSIS多维公平均衡评价视寻利公平、损失规避和参考依赖为判断房地产征收项目是否公平补偿的三个评价准则,视不同的策略组合为评价方案,构建多维公平博弈矩阵,采用TOPSIS法排序,得出多维公平博弈均衡解.案例分析证明多维公平均衡能有效推动关联主体公平信念判断的一致性转变,房地产征收补偿极端争议得以化解.  相似文献   

11.
在分析计算机网络对抗问题特点基础上,将博弈论与马尔可夫决策相结合,以折扣总回报值为目标函数,提出计算机 网络对抗行动的马尔可夫博弈新模型. 运用凸分析理论证明得到网络对抗新模型存在均衡策略,并将攻防双方的均衡策略转换为一个非线性规划问题进行求解. 通过算例分析,验证了方法的可行性和有效性.  相似文献   

12.
通过构建一个三阶段完全信息动态博弈模型,研究了需求不确定下,企业债务融资策略对具有溢出效应的技术创新活动与产量竞争策略的策略性影响.同时,对存在与不存在融资策略的两种企业竞争均衡结果做了比较研究.研究表明,除了受溢出效应影响之外,债务融资决策也对企业的技术创新活动有重要影响;企业的产量决策受债务融资和技术创新的双重影响.  相似文献   

13.
将复杂适应系统的主体适应机制引入元胞自动机的网格动力学模型,以基于复杂适应系统的多主体联动博弈行为为研究对象,将预测行为、自动修正能力赋予元胞主体,创新地提出了一种解决多方协同博弈的方法,通过构建博弈规则模型和状态转移方程不断修正局部均衡从而达到具有协同机制的全局均衡,并通过基于SWARM构架的仿真为进一步探究复杂系统内群体的行为决策和演化机制提供了模拟平台。模型分析有效地获取和计量系统中主体的行为由于适应性而具备的涌现机制。  相似文献   

14.
在项目组合选择问题中,历史数据的缺乏以及预测和估计过程中出现的不可避免的误差,会导致模型中的参数无法被准确地估计,进而给决策带来巨大的风险.因此,构建合适的鲁棒优化模型,为企业提供能有效应对参数不确定性的鲁棒解,对企业的风险防范具有极其重要的现实意义.本文首先对确定参数下的主动打断项目组合选择问题数学模型的特点进行了分析.进一步地,介绍了鲁棒优化问题中不确定情境集的概念,并给出了允许管理者根据其偏好确定不确定情境集大小的方法,构建了全新的基于情境的鲁棒优化模型,进而计算出在所规定的不确定情境集内的最坏情境下能保持可行性与最优性的鲁棒解,实现了鲁棒性与最优性间的权衡,最后,通过GAMS/BARON进行了算例分析,验证了模型的合理性与有效性.从理论上,本文首次将鲁棒优化理论扩展到了主动打断项目组合选择问题中,针对现有的项目组合选择问题鲁棒优化理论仅能应对有限个可行解的不足之处,提出了一类新的鲁棒优化方法,使其能够应对具有无穷多可行解的主动打断项目组合问题.从实践上,随着我国高新产业的发展,具有超前性与特殊性的研究与发展(RD)、信息科技与信息系统(IT/IS)等新兴项目的投资日益受到重视.相较于传统项目,这类项目的高度不确定性使得探究项目组合选择问题的鲁棒优化理论日益迫切.故而本文的研究具有明显的理论价值和现实意义.  相似文献   

15.
突发事件的发生发展具有高度不确定性,机械的应急管理组织系统缺乏适应性,难以有效应对.基于NK模型,以适应度景观的复杂性和动态性刻画应急管理决策情景的不确定性,研究简单稳态、复杂稳态、简单动态、复杂动态情景下,集权、分权和层级等决策模式的组织系统的适应性特征,以及组织文化、决策者能力、信息流等因素的影响机理.结果表明,简单稳态情景下,应采用分权模式且促进信息共享;复杂稳态情景下,宜保持适度集权;动态情景下,应采用层级模式并加强信息沟通.决策者能力与决策重心相一致,能有效增强组织系统的适应性.当信息流超过决策者能力时,具有合作文化的分权模式适应性较好.研究为中国应急管理体系顶层设计与模式重构提供理论方法.  相似文献   

16.
不确定环境下编队对地攻防对抗决策方法研究   总被引:1,自引:0,他引:1  
以对策论为理论基础,以编队协同对地攻防对抗作战为背景,建立了动态对抗决策模型.针对不确定环境下的军事指挥决策问题,提出了不确定影响因子概念,反映战场不确定环境对各参战单元产生的影响程度,建立了不确定环境下的对抗决策模型.并通过不确定模拟方法进行解算,结合双矩阵对策方法得到对抗策略平衡点.仿真结果表明,该算法能够合理处理战场不确定环境带来的影响,客观分析作战结果,为作战指挥决策提供有力的决策支持,仿真结果合理有效.  相似文献   

17.
为使5G混合专网结构的2种用户能获得最优计算卸载策略,将2种用户竞争移动边缘计算(mobile edge computing,MEC)服务器资源的问题建模成Stackelberg博弈,并分别讨论了完全信息博弈和不完全信息博弈下的策略。完全信息博弈下,存在唯一纳什均衡解;不完全信息博弈下,将环境建模为部分可观测的马尔可夫决策过程(partially observable Markov decision process,POMDP),并提出一种基于二阶段深度强化学习(two-stage deep reinforcement learning,TSDRL)的最优卸载策略。仿真实验表明:该算法相较于D-DRL算法能减少20.81%的时延及3.38%的能耗,有效提高用户QoE(quality of experience)。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号