首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 581 毫秒
1.
进化博弈中多代理人强化学习模型   总被引:4,自引:2,他引:4  
将强化学习引入到进化博弈中,建立了进化博弈中的多代理人强化学习模型,并基于Q-学习给出了算法流程,仿真算例的结果表明多代理人强化学习模型能使得博弈人不断学习、寻求最优策略.  相似文献   

2.
有限理性下的演化博弈与合作机制研究   总被引:4,自引:2,他引:2  
指出了以Nash为代表的经典博弈论及其纳什均衡解在完全理性假设下的理论缺陷,从而引入有限理性下的演化博弈论.介绍了演化博弈论中策略进化的思想,提出有限理性的实质是怎么去学习,进而探讨了演化博弈中的各种学习模型.介绍了基于个体的学习模型和网络上的演化博弈研究进展;提出了用演化博弈去解释现实复杂网络的设想;分析了网络结构和博弈策略的互演化思想.讨论了演化博弈框架下合作的进化及合作机制的研究进展.最后,对演化博弈今后的发展趋势和研究方向给出了评述.  相似文献   

3.
运用Stackelberg博弈模型讨论了企业家对风险投资家的激励问题,并对博弈双方的均衡投资决策进行分析.首先通过引入融资契约中常用的"激励因子",分别建立了风险投资家和企业家的支付函数以及Stackelberg博弈模型;然后通过逆向归纳法分析该模型,讨论了作为领导者的企业家的自有资本和"激励因子"对作为跟随者的风险投资家的总投资水平及资本结构的影响,在此基础上,分析了企业家的均衡投资决策,给出了企业家激励风险投资家提供风险资本的必要条件,从而解决了企业家对风险投资家的激励问题.通过研究发现:风险投资家的总投资水平由债权"激励因子"和其边际投资机会成本决定,而股权投资水平由其"激励因子"、主观收益率的参数以及绝对风险厌恶因子决定.尽管风险投资家较企业家风险厌恶,但是后者可以通过激励前者,使前者对于新创企业前景较自身乐观.  相似文献   

4.
为明确监管科技对互联网金融行业监管的影响,构建互联网金融企业与金融监管机构的演化博弈模型,分析监管科技对博弈双方演化稳定策略选择的影响.结果表明,互联网金融监管易陷入此消彼长的博弈对抗状态,而监管科技的引入能够打破双方的不良策略选择,使系统进入严格监管、合规经营的相对稳定状态;监管科技的投入程度、成本节约及其风险识别能力是影响监管科技应用效果的关键因素.因而,政府应完善各级金融监管机构政绩考核制度,提供技术和制度保障促进监管科技发展,落实监管科技应用,以防范金融风险.  相似文献   

5.
仿真网格中资源分配的进化博弈研究   总被引:1,自引:0,他引:1  
网格环境中用户的有限理性使得资源分配不能直接实现纳什均衡.针对网格用户理性的局限性,提出了一种基于进化博弈的网格资源分配策略,从动态角度来考察网格用户群体行为的演化过程.该策略先将网格环境中多用户竞争同一计算资源的问题形式化为一个多人博弈;然后建立了用户之间的进化博弈模型,利用复制动态方程求得用户出价博弈的进化稳定策略;最后研究了不同情况下用户群体的进化稳定点和评估函数特性.仿真实验结果表明进化博弈方法能够通过反复博弈使得网格用户不断学习并调整策略,逐步达到进化稳定均衡,从而实现了网格资源的优化分配.  相似文献   

6.
进化博弈模型中有限理性个体学习机制设计框架   总被引:8,自引:0,他引:8  
进化博弈突破了传统博弈理论完全理性的限制,提出了一种动态分析方法,模型中的动态产生的根源就是个体的学习行为,因此学习机制的设计是分析进化博弈问题的基础。本文在划分决策过程的基础上提出学习机制的设计框架,并针对不同的决策阶段具体设计了不同的学习机制模型,为进一步研究进化博弈问题提供了理论依据。  相似文献   

7.
绿色供应链中政府与核心企业进化博弈模型   总被引:18,自引:2,他引:18  
为探究绿色供应链中政府与核心企业的博弈过程,在分析政府和企业在不同策略下各自的成本和收益基础上,运用进化博弈理论研究了政企双方的博弈关系.博弈分析结果显示:核心企业开展绿色供应链管理的成本和收益、政府对企业是否开展绿色供应链管理的奖惩力度,都直接影响博弈结果;政府和核心企业两个群体,在三种情况下存在进化稳定策略.政府和企业为了获得长远的利益,政府制定不断严格的环保法规,加大奖惩力度;核心企业应首先主动实施环境管理,积累相关环保经验,并进一步影响其上下游的企业,这是政府和企业保护环境、双方实现长期共赢的必由之路.  相似文献   

8.
基于PSO神经网络的进化博弈研究   总被引:4,自引:0,他引:4  
针对进化博弈中博弈人是有限理性的,提出了一种基于粒子群神经网络的进化博弈决策机制。该机制将神经网络技术引入到进化博弈中,并采用粒子群优化算法(PSO算法)来训练神经网络,因而可利用神经网络来模拟博弈人在进化过程中的学习和策略调整。利用该机制分别对有限理性条件下的鹰-鸽博弈和重复囚徒困境博弈进行了研究。实验表明:PSO神经网络可以准确地模拟进化博弈中博弈人的动态学习与决策过程,能有效地指导博弈人的策略选取,是进化博弈分析的有力工具。  相似文献   

9.
基于高校廉政风险防控体系三方主体行为分析的基础上,运用进化博弈理论和系统动力学理论,建立了高校廉政风险防控体系进化博弈模型,进而通过算例模拟计算,分析了该模型的稳定性,探讨了高校廉政风险防控体系中影响三方主体博弈的因素,并对每个因素的影响机理进行了分析,指出了高校廉政风险防控系统的进化方向,提出了可行性的建议和思路。  相似文献   

10.
合作竞争博弈中的复杂性与演化均衡的稳定性分析   总被引:35,自引:0,他引:35  
从博弈参与人的有限理性出发,探讨了合作竞争博弈中复杂性存在的根源,在此基础上应用演化博弈论的方法探讨了合作竞争博弈的演化模型,这是一个复制动态模型,因而我们可以借用生物学中的"复制动态"机制来模拟参与人的学习与调整机制,用"进化稳定策略"来描述合作竞争博弈的长期演化趋势,最后分析了一个水平差异化产品的合作竞争博弈的演化均衡与稳定性,及其演化过程中所表现出来的复杂性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号