首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
本文研究随从目标函数非凸时的诱导问题.提出函数约束凸性的概念,得到了函数在某点具有约束凸性的充要条件和具有约束凸性的函数取最小值的充分条件,并利用约束凸性的概念得出了随从目标函数非凸时连续诱导策略存在性的充要条件.  相似文献   

2.
本文中讨论了具有多个不合作随从的Stackelberg对策问题,给出具有使得领导所希望的策略为不合作随从们不同目标函数共同最优策略性质的激励策略的存在条件及仿射型表达式。  相似文献   

3.
本文旨在研究铁路局与物流企业的关系以及两者在合作和非合作中的状态,主要从他们的投资和定价两个方面进行考虑,利用两者博弈的理论展开分析,两者在非合作和合作的状态考虑在投资和定价两方面的最大化利益的博弈。一方面构造了非合作性投资价格策略两阶段博弈模型,另一方面构造了合作性投资价格策略的博弈模型,两者均讨论了博弈子博弈的均衡解的存在与否,并推出了一些重要结论。研究发现均为互补性的铁路局与物流企业的两家企业在考虑投资定价两个重要因素时,其无论在投资支出还是价格收益上,两者选择合作均优于非合作状态。  相似文献   

4.
合作进化模型综述   总被引:2,自引:0,他引:2  
作者综述了合作进化模型的最新研究成果。合作进化模型以“囚徒困境”博弈模型为基础, 为合作中的个体提供了一种与个体本身无关的策略优化机制, 以此探讨合作策略能够稳定进化的条件。基于直接或间接互惠理论的合作进化模型验证了在小规模社会中建立声誉机制有助于实现稳定的互惠合作; 互惠可以看做是对合作行为的奖赏, 开放的社会网络有助于实现较大范围内的合作; 对非合作行为实施惩罚有助于实现多人合作, 在一定条件下, 由非合作者实施惩罚时的合作进化相较于由合作者实施时更稳定; 群组竞争有利于合作文化或制度的传播, 但无法解释群组融合后的合作问题。  相似文献   

5.
作者综述了合作进化模型的最新研究成果。合作进化模型以"囚徒困境"博弈模型为基础,为合作中的个体提供了一种与个体本身无关的策略优化机制,以此探讨合作策略能够稳定进化的条件。基于直接或间接互惠理论的合作进化模型验证了在小规模社会中建立声誉机制有助于实现稳定的互惠合作;互惠可以看做是对合作行为的奖赏,开放的社会网络有助于实现较大范围内的合作;对非合作行为实施惩罚有助于实现多人合作,在一定条件下,由非合作者实施惩罚时的合作进化相较于由合作者实施时更稳定;群组竞争有利于合作文化或制度的传播,但无法解释群组融合后的合作问题。  相似文献   

6.
针对复杂网络条件下多UAV系统任务区集结问题,提出了多机非合作求解方法.首先,基于协调变量和协调函数,建立多UAV集结问题的分布式求解框架.从任务特征出发,改进多智能体时延相关平均一致性算法,提出非合作优化一致性策略.该方法更强调平台的轨迹控制,弱化UAV对路径规划算法的要求,不仅能够降低集结问题的求解难度,而且使多UAV系统具有较强的动态响应能力.仿真实验验证了非合作优化一致性策略的正确性,多UAV能够在复杂网络条件下实现任务集结.  相似文献   

7.
讨论当主从对策中存在多个从方时,主方对多个从方的诱导策略的设计问题.给出了最优诱导策略和可诱导域的定义,研究了仿射型诱导策略的存在条件及解的结构形式,并探讨了当主方只具有对从方决策的部分观测时的诱导问题.  相似文献   

8.
多机器人系统的追捕-逃跑问题是人工智能领域一个非常重要的问题.本文为实现多追捕者协作追捕逃跑目标,提出了一种基于Fast Marching方法的多机器人协作追捕策略.追捕过程中,追捕者数量多于逃跑者的情况下,协助追捕者通过构造“活跃区域”与主追捕者的合作,实现一种压迫式的追捕策略.  相似文献   

9.
利用线性粘弹性力学中的微分型本构关系,建立了粘弹性Timoshenko曲梁在均布随从力作用下的屈曲运动微分方程。分离屈曲位移中的空间变量和时间变量,采用归一化幂级数法建立起该非保守系统的复特征方程,在考察位移单值性条件的基础上,运用拟牛顿法得出粘弹性曲梁振动参数随随从力的变化关系曲线,研究了支承条件对粘弹性曲梁非线性动力稳定性的影响,并考察了材料粘性对结构动力稳定性的影响。  相似文献   

10.
引进多组线性二次微分对策的非劣Nash策略的概念,证明非劣Nash策略存在的充分必要条件。在组与组之间Nash竞争而组内部合作的前提下考虑组内第二对策目标,以组内合作权向量为变量构造组与组之间的静态对策问题,得到使第二对策目标平衡的最优合作权向量,进一步得到同时满足第一目标非劣,第二目标平衡的非劣Nash开环策略。最后,以两组经济对策为算例说明该策略的有效性。  相似文献   

11.
多事故多救援站点的应急车辆调度问题中,在处置当前事故时,若将空闲车辆再配置于救援站点,有利于对潜在事故的快速响应.文中采用双层规划理论和非合作博弈理论建立应急车辆调度与再配置模型.上层模型在事故需求和救援时间窗约束下,最小化当前事故响应时间;下层模型将各救援站点视为非合作博弈的局中人,综合考虑车辆再配置时间和救援站覆盖区域潜在风险,确定局中人的收益函数,将优化再配置策略转化为寻求非合作博弈的纳什均衡.然后,提出一种层次混合蛙跳算法,其中上层算法用于求解约束单目标规划问题,下层算法用于求解非合作博弈模型.求解事故算例证明了应急车辆调度与再配置模型的合理性和层次混合蛙跳算法的有效性.  相似文献   

12.
文中讨论了多随从双层规划问题。根据对策论中Nash均衡点的思想和多目标决策中极大模理想点技术,给出了极大Nash理想点的定义,并对多随从双层规划问题引入了极大Nash最优解的概念。最优解概念不仅有效地解决了随从响应不唯一所带来的解的不确定性,而且利用变换可以将对应的问题转化为求解过程比较容易的数学模型。用不动点定理证明了极大Nash最优解的存在性,并证明了解集的闭性。  相似文献   

13.
提出一种基于活跃区域的多机器人分层追逃算法,根据追捕时间及效率将多个追捕者和逃跑者分派到多个单一的双人追逃方案中,在追捕者多于逃跑者的情况下形成协作追捕者.协作追捕者观察需要其追捕的追逃者当前的运动曲线方程,利用快速推进法计算逃跑者未来的活跃区域,并根据该活跃区域执行压迫式追捕.通过对追捕者和逃跑者采用不同的策略进行仿...  相似文献   

14.
引进多组对策系统组内部合作对策非劣解的线性型功效系数方法,证明最优解是组内部隐含某一权重向量的合作对策的非劣解,由此得到合作对策的单目标规划问题.在组内部该问题的解不仅是非劣的,而且对于所有局中人都优于不合作时的Nash平衡策略.利用组与组之间的非劣反应集,构造求解非劣Nash策略的迭代算法.该算法在保留文献[3]优点的前提下,克服其缺点,得到的解优于文献[3]对应的解.最后,用实例验证了该算法的有效性和正确性,所得结论丰富了多组对策问题的内容.  相似文献   

15.
针对交通诱导系统中可变信息标志(VMS)的控制策略设计,该文在宏观Metanet交通流模型的基础上,研究了VMS诱导控制信号对驾驶员路径选择行为的影响,建立了路网诱导控制的状态方程模型。在模型预测控制(MPC)框架下设计了VMS诱导控制策略,以优化路网所有车辆的总旅行时间和VMS切换性能为目标函数,通过对诱导控制变量引入用户可接受约束,有效兼顾了交通管理者对系统最优的控制需求和交通用户对VMS推荐路径的可接受性。最后设计了基于禁忌搜索的双层并行求解算法对MPC诱导策略进行求解,利用并行计算保证MPC控制的实时性要求。仿真结果表明,该文设计的诱导控制策略能缓解路网拥挤,提高路网通行能力,对系统随机扰动具有较好的抗干扰能力。与基于系统最优的诱导策略和基于用户均衡的诱导策略相比,该控制策略不仅能满足管理者的控制需求,而且能均衡路网车流分布,减少交通用户的延误时间,提高用户对交通诱导系统的满意度。  相似文献   

16.
相同企业竞争策略与合作策略的收益与风险分析   总被引:3,自引:2,他引:1  
以产销量为策略变量,以利润最大化为目标,建立了相同企业竞争策略模型与合作策略模型,分别对比了两个相同企业及多个相同企业竞争策略与合作策略的收益与风险,得出了合作策略比竞争策略的产量低、价格高、收益大、风险大的结论.进一步的风险分析表明,企业可根据价格信息的公开性及时改变策略,减小合作策略的风险.同时指出,实施合作策略的企业并不是没有竞争,而是把以产销量为重点的竞争转到降低成本上.降低成本才是增加利润的核心.最后给出了一个算例.  相似文献   

17.
提出一种基于非合作模型预测控制(model predictive control, MPC)的智能汽车人机共驾策略.首先,建立了驾驶员和控制系统两者共同控制车辆的人机共驾系统模型.接着,得到了驾驶员和控制系统的代价函数.然后,求解了非合作MPC人机共驾策略的纳什均衡解.最后,通过仿真验证了非合作MPC人机共驾策略的优点和有效性.证明了非合作MPC的纳什均衡解可以通过非迭代的方法求解,并通过驾驶员和控制系统置信度矩阵的更新实现了驾驶权的逐渐交接.Matlab仿真表明,非合作MPC人机共驾策略可以在智能车辆遇到危险时将驾驶权逐渐从驾驶员转交给控制系统,同时保证驾驶员实时在环.  相似文献   

18.
用有限差分法得到了经典约束下的粘弹性杆在随从力作用下的复特征值方程,再用拟牛顿法求解,得到了简支和悬臂非保守粘弹性杆的一阶复特征值问题的复频率的实部和虚部与随从力的关系曲线.而非保守弹性杆的问题可作为本文的特例.  相似文献   

19.
针对分布式系统中任务调度问题,根据分布式环境下的任务调度特性,建立了一个非合作博弈的多角色任务调度框架,在此基础上提出了一种基于纳什均衡联合调度策略的分布式强化学习算法.相比于静态调度算法,该算法需要更少的系统知识.能使调度器主动学习任务到达和执行的相关先验知识,以适应相邻调度器的分配策略,目标是使得调度器的策略趋向纳什均衡.模拟实验结果表明:所提出的算法在任务的预期时间和公平性上相对于OLB(机会主义负载均衡)、MET(最小执行时间)、MCT(最小完成时间)等同类调度算法具有更好的调度性能.  相似文献   

20.
以在决策周期内定购总次数必须为整数这一客观条件为前提,研究了随机需求下合作博弈和非合作博弈时两级供应链的协调策略.相对于新的前提条件,用新的求解方法求出了非合作博弈的斯塔克博格均衡解和合作博弈的帕累托最优解,给出了由于合作带来的额外利润的分配策略,并用模拟算例验证了分析结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号