首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
为解决现有的巡逻路径规划算法仅仅能够处理双人博弈和忽略攻击者存在的问题,提出一种新的基于多agent的强化学习算法.在给定攻击目标分布的情况下,规划任意多防御者和攻击者条件下的最优巡逻路径.考虑到防御者与攻击者选择策略的非同时性,采用了Stackelberg强均衡策略作为每个agent选择策略的依据.为了验证算法,在多个巡逻任务中进行了测试.定量和定性的实验结果证明了算法的收敛性和有效性.   相似文献   

2.
本文讨论了多阶段费用变动型EOQ存储问题的若干订购策略,指出通过数据模拟方法分别得出在费用参数单调变化时的最优策略的不可行性,并针对费用参数单调变化的情况,建立了其相应的存储模型,并给出了该模型最优解的求解算法。  相似文献   

3.
本文在两阶段逆向供应链产品回收模式的基础上,建立了基本的三阶段逆向供应链产品回收模型,即"消费者——零售商——第三方——制造商",并应用Stackelberg均衡决策对三阶段逆向供应链产品回收过程中的各个节点进行博弈决策。  相似文献   

4.
非线性对策系统的Stackelberg解一般无法求得,特别是当系统约束方程存在振荡或浑沌现象时,更使问题复杂化。本文给出了满意Stackelberg解的一般求取方法。  相似文献   

5.
用动态规划方法研究多阶段资源分配问题,建立了数学模型,通过状态转移方程得出一个简单的求解该问题的方法.  相似文献   

6.
采用博弈论模型分析了电网公司与单个独立发电企业之间的交易情况,这里建立的模型属于独立发电企业非合作竞争模型。  相似文献   

7.
供应商管理库存(VMI)的模式可以有效避免供应链牛鞭效应,提高供应链整体效率.在短期内,下游企业相对更愿意实行VMI供应链模式以减少库存成本等,获取更大收益;而对供应商来说,这种模式的收益并不显著.因此,VMI模式下,供应商与下游企业之间存在一种博弈关系.本文从供应链整体收益以及利润分配等角度,综合比较、分析各类研究VMI供应链利润分配的博弈模型,系统阐释了博弈对于供应商与其下游企业之间利润分配的影响.结果表明,在Nash讨价还价模型中,双方议价能力是决定各自利润分配的主要影响;在Stackelberg博弈中,先行优势明显.最后,指出模型改进以及深入研究的方向,可从激励与补贴机制、Shapley合作博弈等角度优化博弈模型.  相似文献   

8.
为了求解多阶段群体决策问题,作者建立了多阶段群体决策模型,定义了Pareto最优策略及绝对最优策略等概念,提出了求解Pareto最优策略的群体动态规划算法.该算法可以求得各个阶段各个状态下的所有Pareto最优策略.最后,作者用一个计算实例说明了算法的求解过程.  相似文献   

9.
引进了交叉规划模型中关于决策者最优个体值的均衡因子的概念,构造了一类求解交叉规划模型的联合均衡方法,给出了交叉规划模型基于该方法的联合最优解的定义、性质及求解方法,数值例子表明该方法对于求解交叉规划模型具有一定的有效性。  相似文献   

10.
激励Stackelberg策略下的电价算法   总被引:3,自引:0,他引:3  
讨论了电力市场中制定电价算法的问题.首先将对策论中的激励Stackelberg策略概念引入到简化了的电力市场系统模型中.从用户获取最大效用函数的角度出发,研究了适合于电力市场合理发展的动态电价的新方法.该算法较以往单一电价的制定更加合理,具有激励性质.根据电力公司的生产能力再结合当时当地用户对电力的需求,分别采用线性激励策略和非线性激励策略,制定更加合理有效的电价政策.利用MATLAB对所制定的两种激励策略进行了数值仿真,仿真结果说明所得方法的有效性和结果的实用性.  相似文献   

11.
市场需求的快速变化要求供应链成员企业采用灵活的协调机制来提高供应链的运营效率和利润.由单一供应商和单一零售商组成的供应链中,对供需双方分别占主导地位的回购协调机制进行研究,建立了Stackelberg博弈模型,考虑供应链市场需求信息对称且需求具有价格弹性,并确定模型的均衡解.通过Maple软件进行模拟仿真,分析决策变量之间的关系,计算不同类型供应链(无回购、供应商主导或零售商主导的回购机制)中供需双方的利润关系,证实回购机制可以达到双赢,并得出决策变量对利润的影响.模型为供应链成员企业提供决策支持,指导供需双方选择合适的博弈策略以实现销售目标.  相似文献   

12.
本文中讨论了具有多个不合作随从的Stackelberg对策问题,给出具有使得领导所希望的策略为不合作随从们不同目标函数共同最优策略性质的激励策略的存在条件及仿射型表达式。  相似文献   

13.
讨论了不完全信息下多步主从对策及有记忆的反馈诱导策略,提出并研究了当从方具有多个目标时的不完全信息下多步主从对策的激励相容机制  相似文献   

14.
广义古诺模型的一种求解方法   总被引:1,自引:0,他引:1  
古诺模型是博弈论中的一个经典模型,对它有不同的求解方法,本文推广了古诺模型并详细讨论了广义古诺模型的经济含义以及重复剔除严格劣势战略求解法。  相似文献   

15.
讨论当主从对策中存在多个从方时,主方对多个从方的诱导策略的设计问题.给出了最优诱导策略和可诱导域的定义,研究了仿射型诱导策略的存在条件及解的结构形式,并探讨了当主方只具有对从方决策的部分观测时的诱导问题.  相似文献   

16.
研究不完全信息下的序贯Stackelberg对策问题中主方对从方的激励机制,给出了有记忆的反馈诱导策略的概念和序贯对策过程,分析了激励相容机制序列,探讨了序贯对策中激励机制约序列均衡问题.  相似文献   

17.
讨论了无限次重复博弈中两段策略的有关内容。结果表明,在折现率δ=1/2时,两段策略不能构成子博弈完备的纳什均衡。  相似文献   

18.
综合能源系统(IES)是解决能源生产与分配等问题的重要能源系统之一,考虑电动汽车作为综合能源系统中重要的主动负荷,合理引导其充电能促进综合能源系统的高效运营,提出了综合能源系统与电动汽车的主从博弈优化运行模型。在主从博弈框架下,以综合能源系统为领导者,各电动汽车为跟随者,构成一主多从优化调度模型。根据博弈的阶段性特点,提出基于引力搜索算法和混合整数线性规划的两阶段主从博弈求解方法。算例对比分析表明,通过主从博弈,综合能源系统能合理地引导电动汽车有序充电,有效整合分布式能源并提高了运行的整体经济收益。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号