首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 55 毫秒
1.
研究有限种群中2×2的对称博弈,假设采取不同策略的个体具有不同的选择强度,建立选择差异下Moran更新过程的随机博弈模型.利用扩散近似的方法得到选择差异下Moran过程策略的扎根概率,扎根概率不仅与博弈收益矩阵和种群的大小相关,还与策略的差异选择强度相关.通过比较弱选择和中性选择下策略的扎根概率,分析自然选择有利于策略在种群中扎根及策略成为演化稳定策略的条件.在常见的三种博弈:囚徒困境,共存博弈和协调博弈中,利用数值分析方法,得到扎根概率与选择强度及种群大小之间的关系;利用仿真方法得到扎根时间与选择强度之间的关系.最后将选择差异下的Moran过程随机博弈模型,应用于解决第三方物流企业是否参与供应链金融的策略选择问题.求解第三方物流企业参与供应链金融策略的扎根概率,分析有利于参与策略扎根及参与策略成为演化稳定策略的条件,利用数值和仿真分析方法得到各参数变化对第三方物流企业博弈行为的影响.本文的研究内容扩展了Moran更新过程的随机演化博弈理论.  相似文献   

2.
国际反恐联盟成员国反恐决策面临着大国政治角逐、宗教信仰与民族结构等外部复杂的随机性因素影响,为国际反恐局势带来了高度的不确定性.本文针对高度不确定环境下国际反恐态势,构建了基于Moran过程的随机演化模型,分别计算出随机因素主导、期望收益主导和超期望收益主导三种情境下,反恐联盟成员国政府反恐策略在不同随机干扰强度下的均衡结果.研究表明,反恐联盟成员国政府采取先发制人或被动反应的反恐决策,主要取决于三个因素:1)外部随机性因素;2)反恐联盟的规模;3)不同反恐策略的成本收益.如果随机因素造成非理性决策占据主导地位,则两种策略的成本收益和成员国数量决定了成员国策略选择.如果期望收益占据决策主导地位,只有当反恐联盟的成员国数量大于一定的临界规模时,先发制人反恐策略才会成为所有成员国的普遍共识.否则,被动反应的反恐搭便车行为将成为稳定状态.  相似文献   

3.
考虑生产同质产品的Ⅳ个制造商生产策略的演化性态,每个制造商可选择利润最大化或者收入最大化两种生产策略.基于Moran过程的固定点概率,计算出在有限个制造商中,利润最大化生产策略和收入最大化生产策略成功入侵的概率,计算只有一个个体选择利润最大化或收入最大化生产策略时,单个制造商分别选择两种策略之一所得的期望收益,认为选择行为支持收益较大的策略入侵.在选择行为支持策略入侵与取代的意义下,分别得到利润最大化生产策略和收入最大化生产策略占优的条件.研究发现,制造商生产策略的选择取决于制造商的总体数量和其生产成本因子.若生产成本因子很小,则收入最大化策略是更合适的生存策略;若生产成本因子较小,在制造商数量少时,收入最大化生产策略占优;若生产成本因子较大,则制造商数量多时,利润最大化策略占优,制造商数量少时,收入最大化策略是占优策略.进一步通过数值例子发现,若制造商数量一定,在生产成本因子比较小时,收入最大化生产策略是占优策略,当生产成本因子比较大时,利润最大化生产策略是占优策略;若生产成本因子很大,则利润最大化策略是更合适的生存策略.  相似文献   

4.
引入分位数定义了随机支付值的偏好,并在此偏好的基础上定义带随机支付双矩阵博弈的纳什均衡.建立了有限种群进行带随机支付2×2双矩阵博弈的演化博弈模型,应用有限状态空间的拟生灭过程刻画了在有随机扰动的博弈环境中有限理性个体的学习调整动态,描述了理性演化的不确定性过程,讨论了拟生灭过程的平稳分布与演化模型的长期均衡以及博弈的纳什均衡之间的关系.最后,基于分块矩阵的Guass消去法给出求解模型稳态分布的数值算法,并通过数值实例对演化博弈模型均衡解的实现进行了说明.  相似文献   

5.
运用实验经济学研究了投资者通过重复随机协调博弈寻找最优决策的过程,并在此基础上分析了投资者情绪演化机制和原理。实验证据证明,此博弈中任何形式的协调都是投资者通过不断寻找聚点均衡,并理性选择完美贝叶斯纳什均衡的结果。这一演化机制不但揭示了诸如动量效应、反转效应和过度交易等常见的证券市场投资者情绪背后的形成机理,还证实了即使在理性假设前提下,投资者通过群体博弈仍然会形成非理性情绪的演化和集聚。  相似文献   

6.
基于随机演化博弈的战略联盟稳定性分析和仿真   总被引:2,自引:3,他引:2  
借助演化博弈论考虑了大群体成员下的战略联盟成员策略演化过程,建立了复制动态方程.指出了现有的确定性动态方程的不足,从人群工作互动角度探讨了策略演化过程中扰动的来源,在此基础上,对方程引入白噪声来反映过程所受到的随机干扰,建立了随机动力系统,借鉴 Itô 随机微分方程理论来分析战略联盟演化过程中成员行为稳定性的问题.给出了联盟保持稳定的一个充分条件和解体的一个充分条件,以此来解释战略联盟的有效性问题.利用计算机进行了仿真,针对结果将本模型与现有确定性的动力模型进行了比较,两次仿真实验测度了联盟演化的随机动力模型的有效性.  相似文献   

7.
随机需求下电力竞价市场演化均衡分析   总被引:3,自引:1,他引:3  
基于2×2非对称演化博弈原理,分别针对电力市场中的MCP与PAB竞价机制,分析了随机电力需求下的电力竞价市场演化情况;在此基础上,从市场效率的角度对演化均衡进行政策分析,并给出了竞价市场收敛于报价下限处的条件;分析表明:①MCP机制相对于PAB机制更易使电力竞价市场收敛于报价下限处;②若报价下限一定,使电力竞价市场收敛于报价下限的报价上限要么较大要么逼近报价下限;最后进行算例分析。  相似文献   

8.
通过建立“双种群”复制动态模型,研究了有限理性假设下“多对多”讨价还价的策略演化问题,证明了只有严格纳什均衡才能成为“多对多”讨价还价的演化稳定策略. 并利用计算机仿真发现:当买卖双方种群的初始策略为随机分布时,讨价还价的演化稳定策略以最大概率收敛到对称纳什均衡,产生买卖双方最大初始期望收益乘积的纳什均衡可以比较准确地预测“多对多”讨价还价的演化稳定策略,且演化过程不必是单调的. 研究内容有助于理解“多对多”讨价还价的达成协议的一般规律,为设计多边谈判支持系统提供参考和借鉴.  相似文献   

9.
采用演化博弈方法,研究具有代价的第二方惩罚机制对于公共物品博弈均衡选择及群体合作行为的影响.将群体策略选择过程描述成一个多维马氏过程,通过极限分布分析系统演化稳定状态.分别考虑只对背叛策略进行惩罚的一阶惩罚机制和同时对背叛及不惩罚背叛的合作(二阶背叛)都进行惩罚的二阶惩罚机制.研究发现,与一阶惩罚相比,二阶惩罚机制可以在更大参数范围内促进群体合作的产生,系统存在选择不同均衡结果的惩罚参数临界值.并将结果与复制动态模型进行了对比.  相似文献   

10.
利用随机动力系统理论研究了金融市场长期资产投资组合策略财富占有比例的动态演化模型.其中资产价格是内生的, 每期末支付的股息或红利收益只用于消费,在财富不断再投资的过程中, 投资组合的表现由财富的市场占有比例决定.将投资策略和红利收益纳入同一自然状态中考虑其相互影响,分析了固定投资组合策略演化稳定性的充分必要条件,在自然状态服从独立同分布和Markov过程时,给出了唯一的演化稳定投资策略, 得到了一些更加直观具体的结果.进一步,利用中国股市数据,通过计算机进行数值模拟验证了演化稳定投资策略的长期效应.研究结果对证券市场投资策略选择 及探讨市场有效性提供了重要的理论依据.  相似文献   

11.
当前恐怖袭击活动由偶发的单次攻击发展为不同地域内连续发动袭击.考虑政府部门统筹反恐设施选址和应急资源调度,构建了连续恐怖袭击下反恐设施选址优化与反恐资源调度优化的斯塔克伯格博弈模型,并分析政府与恐怖分子的均衡行为.结合新疆喀什地区重要城市反恐设施网络结构的实例,数值分析得出了选址点个数、袭击次数、是否考虑反恐资源调度等因素对政府与恐怖分子最优效用的影响;最优反恐资源投入量与袭击次数和选址点个数之间的关系.研究表明:反恐资源最优投入量、反恐设施选址点个数和政府应急管理能力三者具有替代关系;政府反恐力量联合考虑反恐设施优化选址和反恐资源优化调度的实施效果更好.  相似文献   

12.
医患纠纷已成为制约和谐社会发展的重要矛盾,而在解纷过程中政府规制行为会对双方策略的选择产生重要的影响.通过构建医患双方演化博弈模型,分析了不同程度的政府规制对医患双方策略演进的影响.研究结果表明:政府规制程度不同会导致医患双方产生不同的策略组合,对医院和患者各方的规制程度决定了市场环境中医院的执业状态和患者的行为选择;政府提升对医院的规制效力、加大对患者的规制力度,能够逐步提高医院规范执业的概率,能够不断规范患者的维权途径和方式,使双方行为趋向于规范化;患者的医闹行为在一定程度上是对医院执业状态的揭露;在医患纠纷事件中政府自身定位的差异决定了其规制策略的差异,这会导致医患双方行为演进的结果出现较大的不同.最后结合莆田系医院事件和福建南平医闹事件,分别讨论了政府规制程度不足及规制策略失当情境下医患双方行为的演进结果.  相似文献   

13.
协同治理背景下的环保信用监管既是社会信用体系建设的重要组成,也是国家治理体系与治理能力现代化的重要内容之一;本文在梳理已有研究的基础上,通过构建企业主体、公众主体与监管主体三方参与的环保信用监管演化博弈模型,系统分析了协同治理背景下三方主体的策略选择过程;在此基础上通过仿真建模方法从微观层面研究了不同政策的监管效果,并对三方主体的策略选择过程引入了基于有限理性的随机干扰项,以进一步契合现实世界中策略选择过程的复杂性.研究结果表明,只有环保守信激励强化与履约成本降低协同推进,环保失信处罚与监管主体不监管处罚齐抓共管,才能产生良好的环保信用监管效果;对环保信用监管政策的系统性与协同性的管理是提升政策效果的必要条件.  相似文献   

14.
基于GA-RL的进化博弈求解主从博弈结构的供应链协调问题   总被引:3,自引:2,他引:1  
供应链协调问题多数基于主从博弈结构建模,但如果研究对象是相对复杂的供应链结构.理论求解主从博弈问题就变得困难.因此从求解一对一的供应链协调问题开始,针对主从博弈问题的特点,利用个体学习的进化博弈仿真手段,设计了经销商利用经验分布的预期随机需求的信念更新模式与最优反应的决策模式,为生产商分别设计了基于强化学习的信念更新模式与基于遗传算法搜索策略空间的决策模式,并将两者有机结合,取得了博弈问题的均衡解并且验证该解与理论求解结果一致,为进一步求解复杂问题提供了新的途径.  相似文献   

15.
传统能源的清洁利用和纳入可再生清洁能源是电力企业能源结构低碳化转型的着力点.本文考虑可再生能源和传统煤炭清洁利用双轮驱动,构建了政府部门与发电企业间演化博弈模型,分析政府部门电力补贴政策与发电企业选择能源结构的演化稳定均衡,讨论传统能源清洁利用和可再生清洁能源包容式发展边界条件.研究发现,发电企业高碳化发电模式转换到清洁型模式的演化过程中,存在着周期解或政府补贴政策下发电企业采取综合能源发电的初始态势等过渡状态;政府补贴优惠政策支持促进了发电企业清洁技术创新成本的降低,推动了电力能源低碳化转型的新模式和新业态;可再生清洁能源与传统能源清洁利用容量占比值依赖于两种能源发电预期收益、两种类型的政府补贴及其带来的环境效益.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号