首页 | 本学科首页   官方微博 | 高级检索  
 共查询到20条相似文献,搜索用时 15 毫秒
从参与者对手利益出发,研究对手成本最低的双人合作博弈问题:当博弈活动出现非理性现象及竞争者自身策略不确定情形时,假设竞争者自身支付矩阵能准确获知,对手策略落在混合策略集内,但自身策略集为一非对称有界闭集(混合策略集的子集),提出了合作对偶博弈模型。并采用鲁棒优化技术,研究了双人合作对偶博弈中均衡的求解问题,得到以下结论:当非对称不确定策略集中元素取l1∩∞- 范数时,使对方成本最低的问题可转化成一个线性规划问题,使双方成本同时最低的问题可转化成一个混合互补问题。最后用数值算例验证了模型的合理性和有效性。  相似文献   

通过对传统博弈模型的分析,针对其效率低的Nash平衡解,提出了具有激励机制的改进的“囚徒困境”模型。改进模型包括两个阶段,第一个阶段双方要独立给出用于激励对方合作所支付的成本,第二个阶段双方根据修改后的收益矩阵进行博弈。详细分析了改进模型,并应用基于MAS的建模方法进行了建模仿真。理论分析和仿真结果均表明,在改进博弈模型中采取合作策略的百分比高于传统博弈模型中采取相同策略的百分比,系统收益输出具有Pareto效率,影响收益输出的主要因素是双方提供的支付成本大小。  相似文献   

研究基于生存理论的两类博弈模型(非合作博弈与合作博弈模型)及平衡的存在性。将生存理论思想植入到非合作博弈与合作博弈模型中,构建两类新的博弈模型,并给出新模型的非合作博弈强(弱)平衡和合作博弈强(弱)平衡定义。在满足一定的条件下,得到强(弱)平衡的4个存在性定理。这一工作在理论上拓宽了博弈论的研究范畴,具有一定的现实意义。  相似文献   

施工设备费用是水电工程施工成本的重要组成部分,各标段独立配置的设备规模使部分设备在非施工高峰期处于闲置或低效状态.同时,由于协作机制的不完善导致标段间的设备协作效率低下,设备闲置或利用率低的情况时有发生.基于合作对策理论和方法,建立水电工程施工标段间施工设备协作的合作对策模型,以及基于Shapley值方法的合作利益分配机制.合作对策模型和利益分配机制为施工标段间大规模的设备协作提供了理论依据和操作规则,对于提高设备的利用率,降低工程施工成本,提高施工企业经济效益,防止社会资源的浪费具有重要的理论意义和实用价值.  相似文献   

该文分析了双寡头市场结构下视频游戏产业中竞争平台的定价策略。在Bertrand竞争框架下,根据游戏软件开发商是否可以多重注册、平台是否可以承诺价格,该文讨论了4种情形下游戏平台的定价策略,并分析了平台吸引全部用户、核心用户、轻度用户3种策略的定价模式。结果表明:核心用户与轻度用户之间的差异以及游戏软件开发企业是否多重注册,是影响视频游戏产业价格结构及各方利润的重要因素。在视频游戏产业,能否吸引到轻度用户对游戏主机的销量有着至关重要的影响,可以说,抓住了轻度用户就抓住了主机大战的胜利,这些研究结论对于从业企业制订定价策略有一定的参考价值。  相似文献   

建立了由供应商、制造商、分销商构成的三级供应链上的合作博弈模型,求出了合作博弈模型下各参与人的期望收益——Shapley值,引入Shapley值不确定性的概念,对参与人收益的风险进行了计算。通过与非合作情况进行对比,探讨了不同参与人收益及风险的情况,分析了合作条件下分配方式的合理性。  相似文献   

Emergence of cooperation and evolutionary stability in finite populations   总被引:1,自引:0,他引:1  
Nowak MA  Sasaki A  Taylor C  Fudenberg D 《Nature》2004,428(6983):646-650
To explain the evolution of cooperation by natural selection has been a major goal of biologists since Darwin. Cooperators help others at a cost to themselves, while defectors receive the benefits of altruism without providing any help in return. The standard game dynamical formulation is the 'Prisoner's Dilemma', in which two players have a choice between cooperation and defection. In the repeated game, cooperators using direct reciprocity cannot be exploited by defectors, but it is unclear how such cooperators can arise in the first place. In general, defectors are stable against invasion by cooperators. This understanding is based on traditional concepts of evolutionary stability and dynamics in infinite populations. Here we study evolutionary game dynamics in finite populations. We show that a single cooperator using a strategy like 'tit-for-tat' can invade a population of defectors with a probability that corresponds to a net selective advantage. We specify the conditions required for natural selection to favour the emergence of cooperation and define evolutionary stability in finite populations.  相似文献   

现代对策论中原则上所考虑的理想对策模型可分为两类:策略对策和合作对策。在策略对策中局中人选择使他自己获得最大支付的策略,在合作对策中局中人只考虑使他们所在的联盟所得支付最大,而联盟中个人之间如何分配并没有考虑。许多论文已经探讨了这样的问题:当不完全合作时,局中人往往选择使他们所在联盟得到支付最大的策略来形成联盟。本文中,考虑了具有完全信息的对策,并且在对策树的一些固定结点处随机地改变联盟分割,从而形成了构造最优子树(分枝)的算法,针对这样的对策同时也得到了一种新值(PMS-值)。  相似文献   

根据联盟成员合作与不合作时收益的相对关系的不同,运用博弈分析讨论了企业可能会遇到的四种不同收益结构的多企业联盟博弈的特点及其稳定解集.对不同情况下企业应采取的对策提出了建议.  相似文献   

Variation in behaviour promotes cooperation in the Prisoner's Dilemma game   总被引:1,自引:0,他引:1  
McNamara JM  Barta Z  Houston AI 《Nature》2004,428(6984):745-748
The Prisoner's Dilemma game is widely used to investigate how cooperation between unrelated individuals can evolve by natural selection. In this game, each player can either 'cooperate' (invest in a common good) or 'defect' (exploit the other's investment). If the opponent cooperates, you get R if you cooperate and T if you defect. If the opponent defects, you get S if you cooperate and P if you defect. Here T > R > 0 and P > S, so that 'defect' is the best response to any action by the opponent. Thus in a single play of the game, each player should defect. In our game, a fixed maximum number of rounds of the Prisoner's Dilemma game is played against the same opponent. A standard argument based on working backwards from the last round shows that defection on all rounds is the only stable outcome. In contrast, we show that if extrinsic factors maintain variation in behaviour, high levels of co-operation are stable. Our results highlight the importance of extrinsic variability in determining the outcome of evolutionary games.  相似文献   

结合合作博弈理论和装配产品公差稳健设计建模,提出一种基于Nash仲裁均衡的公差稳健设计方法.首先将考虑稳健设计要求的装配产品质量与成本视为多目标优化对象,通过建立博弈决策方、效用函数,对各博弈方策略进行归属分类,将装配质量和成本多目标优化问题转化为多目标博弈决策问题,并建立相应的博弈模型及效用矩阵,最后采用合作博弈中的Nash仲裁法进行优化求解.该方法应用于车身前端装配总成的公差设计案例,通过与单目标优化方法比较,说明了其工程应用的有效性.  相似文献   

Dreber A  Rand DG  Fudenberg D  Nowak MA 《Nature》2008,452(7185):348-351
A key aspect of human behaviour is cooperation. We tend to help others even if costs are involved. We are more likely to help when the costs are small and the benefits for the other person significant. Cooperation leads to a tension between what is best for the individual and what is best for the group. A group does better if everyone cooperates, but each individual is tempted to defect. Recently there has been much interest in exploring the effect of costly punishment on human cooperation. Costly punishment means paying a cost for another individual to incur a cost. It has been suggested that costly punishment promotes cooperation even in non-repeated games and without any possibility of reputation effects. But most of our interactions are repeated and reputation is always at stake. Thus, if costly punishment is important in promoting cooperation, it must do so in a repeated setting. We have performed experiments in which, in each round of a repeated game, people choose between cooperation, defection and costly punishment. In control experiments, people could only cooperate or defect. Here we show that the option of costly punishment increases the amount of cooperation but not the average payoff of the group. Furthermore, there is a strong negative correlation between total payoff and use of costly punishment. Those people who gain the highest total payoff tend not to use costly punishment: winners don't punish. This suggests that costly punishment behaviour is maladaptive in cooperation games and might have evolved for other reasons.  相似文献   

在现实决策环境中,由于受外部环境、市场状况等不确定因素的影响,收益值无法准确预估,这种情况下用区间数可以很好地表示收益值的可能范围。首先,考虑合作收益分配的公平原则以及每个局中人都希望加入联盟后分配获得的合作收益尽可能多的心理预期,基于区间数的平方距离和最小二乘法,构建使最大合作联盟中所有局中人的区间数平方超量之和最小的二次规划模型,据此确定每个局中人的收益分配值。然后,考虑局中人的权重对收益分配策略的影响,构建相应的二次规划模型,并获得其最优解的解析式,即加权区间数均分剩余值。最后,以冷链物流企业联盟为例,将所提出的(加权)区间数均分剩余值应用于解决实际的合作收益分配策略问题。结果表明:解均满足存在性、唯一性、有效性、个体合理性、超可加性、对称性等合作博弈解的基本性质,据此获得的合作收益分配策略更加公平、合理。  相似文献   

校园招聘中的博弈风险分析对识别招聘过程潜在风险点与提升招聘整体效益具有重要意义,其对优化招聘策略也有重要借鉴。在明确和理顺校园招聘中的博弈主体及其内在关系的基础上,经由三元组合博弈模型及博弈效益矩阵的宏观分析与微观对比,不难发现校园招聘中存在招聘整体效益损失、应聘信任识别偏差与信息利用程度受限等重大风险,进而提出细化招聘程序与提高应聘成本、加强合作引导与建立校际联盟及完善信息发布与积极教育引导等应对策略。  相似文献   

模拟动物行为的多目标可靠性优化设计博弈算法   总被引:1,自引:0,他引:1  
针对多目标可靠性优化设计的求解问题,结合动物行为对博弈方行为方式进行改进,提出模拟动物行为博弈算法.将各设计目标视为不同博弈方,通过随机向量映射技术将设计向量分解为各博弈方的策略集.根据行为匹配规则,将动物的"损人利己型"与"互惠合作型"行为赋予相应博弈方,各博弈方依据所模拟的行为,构建收益函数与目标函数的映射关系.模拟"互惠合作型"行为的博弈方组成联盟,与模拟"损人利己型"行为的博弈方进行多轮博弈,最终得到均衡解.车辆制动器设计结果表明,对比竞争与合作博弈,所提方法具有更高的计算效率.   相似文献   

考虑制造商产品质量改进的时滞效应对消费者参考质量的影响,构建了Nash非合作博弈、协同合作博弈、制造商承担零售商广告成本的部分合作博弈以及零售商承担制造商质量成本的部分合作博弈的供应链微分博弈模型。借助微分博弈原理得到了4种博弈模式的成员均衡策略和供应链绩效。研究发现:产品质量改进的时滞效应影响制造商的质量改进策略,不影响零售商的广告策略;成员的边际收益和成本是影响其策略以及绩效的关键因素。对比分析和数值算例发现:供应链成员的部分合作博弈虽不能实现供应链的完美协调,但可对分散式供应链进行帕累托改进;无论时滞效应存在与否,协同合作博弈下的成员策略、绩效及消费者参考质量水平更高。  相似文献   

二级供应链不同博弈研究   总被引:8,自引:0,他引:8  
研究了由一个制造商和一个分销商构成的二级供应链上厂商在两种讨价还价模型,即:委托-代理博弈模型和合作博弈模型下的收益.通过比较得出结论:合作是对非合作的Pareto改进,同时消费者也会从中获益.在合作博弈模型中,比较了各种解法,并对K-S解法进行了改进,提出了按参与人的贡献量分配收益的方法,得到的博弈均衡解更加合理.对供应链上厂商之间的合作有较强的指导意义.  相似文献   

TIT FOR TAT in sticklebacks and the evolution of cooperation   总被引:17,自引:0,他引:17  
M Milinski 《Nature》1987,325(6103):433-435
The problems of achieving mutual cooperation can be formalized in a game called the Prisoner's Dilemma in which selfish defection is always more rewarding than cooperation. If the two protagonists have a certain minimum probability of meeting again a strategy called TIT FOR TAT is very successful. In TIT FOR TAT the player cooperates on the first move and thereafter does whatever the opponent did on the previous move. I have studied the behaviour of fish when confronting a potential predator, because conflicts can arise within pairs of fish in these circumstances which I argue resemble a series of games of Prisoner's Dilemma. Using a system of mirrors, single three-spined sticklebacks (Gasterosteus aculeatus) approaching a live predator were provided with either a simulated cooperating companion or a simulated defecting one. In both cases the test fish behaved according to TIT FOR TAT supporting the hypothesis that cooperation can evolve among egoists.  相似文献   

考虑实际交通网络中每个局中人成本的问题.在网络中每条边的成本函数为线性函数的条件下,寻找使整个网络可以达到成本最小时的每个局中人的成本;同时考虑每个局中人选择路由策略使自己达到成本最小.研究在可分流(每个局中人的决策对其他局中人的影响可忽略)的自私路由环境中,交通网络每边的成本为线性函数时网络最优流的不公平性.得到在各边的成本函数属于线性函数类时,最优流的不公平性至多为1.  相似文献   

将质量功能展开(QFD)与合作博弈理论相结合,提出一种汽车产品顾客满意度和成本优化设计的新方法.该方法主要包括:通过市场调查和QFD分析,获取顾客需求并转化为技术需求,建立顾客满意度水平评价模型;再通过确定博弈方、博弈效用和博弈策略分组,将顾客满意度和成本的多目标优化问题转化为合作博弈理论模型;然后采用联盟博弈的Shapley值法求解最优值.最后,通过某汽车车门开发示例计算与传统方法进行对比,验证了本文所提出方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号