期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

刘德海陈静锋《系统工程理论与实践》2014,34(12):3157-3166

从"信息传播-利益博弈"的协同演化视角,构建了环境污染群体性突发事件的协同演化博弈模型,然后在NetLogo平台上进行多主体的社会仿真分析.仿真结果表明:环境污染突发事件具有两种协同演化路径,即邻避运动的"协商谈判-信息畅通-相对理性的集体抗议",环境污染群体性事件的"暗箱操作-信息过剩-非理性的集体抗议";在各种收益和信息参数情境下,存在着丰富多样的演化均衡结果;政府施加信息措施的强度作为外部干扰,导致了"演化均衡漂移"现象.地方政府部门既可以通过尊重周边的知情权和参与权采取协商谈判的博弈结构,也可以通过加大信息搜集(或者舆情引导)措施,促使事态朝着周边居民最终接受方案的方向演化. 相似文献

2.

进化博弈中多代理人强化学习模型 总被引：6，自引：2，他引：4

刘伟兵王先甲《系统工程理论与实践》2009,29(3):28-33

将强化学习引入到进化博弈中,建立了进化博弈中的多代理人强化学习模型,并基于Q-学习给出了算法流程,仿真算例的结果表明多代理人强化学习模型能使得博弈人不断学习、寻求最优策略. 相似文献

3.

基于复杂网络少数者博弈模型的金融市场仿真研究

李旲曹宏铎邢浩克《系统工程理论与实践》2012,32(9):1882-1890

本文构造了具有学习机制、学习结构及时间控制策略(持续期策略)的复杂金融网络少数者博弈模型. 基于少数者博弈模型, 以网络学习作为Agent的主要学习机制, 基于随机网络、小世界网络及无标度网络三种网络, 分别对应金融市场中全局信息下的投资者随机决策, 基于社会网络的决策, 及寡头垄断下的决策, 以持续期期作为时间控制要素, 通过仿真观察到金融市场收益分布的"尖峰厚尾"特征、寡头市场股价异常等金融市场复杂现象, 并分析了学习机制、学习结构及持续期策略在博弈中的作用及产生的不同市场效应. 相似文献

4.

基于PSO神经网络的进化博弈研究 总被引：4，自引：0，他引：4

刘伟兵王先甲《系统工程与电子技术》2007,29(8):1282-1284

针对进化博弈中博弈人是有限理性的,提出了一种基于粒子群神经网络的进化博弈决策机制。该机制将神经网络技术引入到进化博弈中,并采用粒子群优化算法(PSO算法)来训练神经网络,因而可利用神经网络来模拟博弈人在进化过程中的学习和策略调整。利用该机制分别对有限理性条件下的鹰-鸽博弈和重复囚徒困境博弈进行了研究。实验表明:PSO神经网络可以准确地模拟进化博弈中博弈人的动态学习与决策过程,能有效地指导博弈人的策略选取,是进化博弈分析的有力工具。相似文献

5.

基于主体风险偏好的邻避冲突秩依期望效用博弈模型

《系统工程学报》2021,(3)

考虑风险偏好因素对主体决策行为的影响,引入偏好函数刻画主体风险属性特征,构建邻避冲突的秩依期望效用博弈模型,分析了政府和公众不同风险偏好下博弈均衡的存在性及其特征.研究发现,风险属性因素对于邻避冲突博弈均衡影响显著;当仅有一方为风险偏好或风险规避时,非理性主体越"保守",理性主体越趋于"和解"策略.若双方均为非理性时,混合均衡结果差异较大,其中政府与公众风险偏好同质时,均衡结果易陷入双方对抗的劣均衡;政府与公众风险偏好异质时,风险规避一方更倾向于强硬或抗争的"对抗"策略,以降低自身利益受损的风险. 相似文献

6.

有限理性下的演化博弈与合作机制研究 总被引：4，自引：2，他引：2

王先甲全吉刘伟兵《系统工程理论与实践》2011,(Z1):82-93

指出了以Nash为代表的经典博弈论及其纳什均衡解在完全理性假设下的理论缺陷,从而引入有限理性下的演化博弈论.介绍了演化博弈论中策略进化的思想,提出有限理性的实质是怎么去学习,进而探讨了演化博弈中的各种学习模型.介绍了基于个体的学习模型和网络上的演化博弈研究进展;提出了用演化博弈去解释现实复杂网络的设想;分析了网络结构和博弈策略的互演化思想.讨论了演化博弈框架下合作的进化及合作机制的研究进展.最后,对演化博弈今后的发展趋势和研究方向给出了评述. 相似文献

7.

仿真网格中资源分配的进化博弈研究 总被引：1，自引：0，他引：1

李志洁程春田 HUANG Fei-xue 《系统仿真学报》2008,20(11):2914-2919

网格环境中用户的有限理性使得资源分配不能直接实现纳什均衡.针对网格用户理性的局限性,提出了一种基于进化博弈的网格资源分配策略,从动态角度来考察网格用户群体行为的演化过程.该策略先将网格环境中多用户竞争同一计算资源的问题形式化为一个多人博弈;然后建立了用户之间的进化博弈模型,利用复制动态方程求得用户出价博弈的进化稳定策略;最后研究了不同情况下用户群体的进化稳定点和评估函数特性.仿真实验结果表明进化博弈方法能够通过反复博弈使得网格用户不断学习并调整策略,逐步达到进化稳定均衡,从而实现了网格资源的优化分配. 相似文献

8.

政府不同应急管理模式下群体性突发事件的演化分析 总被引：5，自引：3，他引：2

刘德海《系统工程理论与实践》2010,30(11):1968-1976

在"事实-价值"的群体性突发事件分析范式下,借鉴奥野正宽和松井彰彦、刘德海和徐寅峰等不同文化接触下博弈均衡演化的分析思路,考虑了基层政府、上级政府和社会弱势群体等存在认知结构差异的心智模型,在此基础上建立了群体性突发事件博弈均衡演化模型,分析了"基层政府动用警力"和"上级政府介入"两种政府应急管理模式的适用条件,群体性突发事件博弈均衡演化的方向和影响因素. 相似文献

9.

多人雪堆演化博弈在愿景驱动规则下的扩展平均丰度函数

王先甲夏可《系统工程理论与实践》2019,39(5):1128-1136

随着博弈理论的深入研究,演化博弈模型在许多社会现象和经济问题的分析中得到了广泛应用.演化博弈模型将策略更新规则引入状态转移方程,得到相应的马尔可夫链,从而研究种群演化状态.当此马尔可夫链无吸收态时,采用平均丰度函数来研究种群演化状态.采用策略更新规则中的愿景驱动规则,通过分析马尔可夫链的平稳分布导出了扩展平均丰度函数.同时,通过将多人演化博弈模型应用于雪堆演化博弈中,得到了多人雪堆演化博弈模型的扩展平均丰度函数.采用数字分析的方式,计算分析了相应参数对平均丰度函数的影响,结合具体案例研究了参数变化如何影响企业在博弈中的行为.研究表明可以通过改变相关参数来提高合作者的占比,这一结论为在实际应用中如何调控相应参数以促进合作指出了方向. 相似文献

10.

合作竞争博弈中的复杂性与演化均衡的稳定性分析 总被引：35，自引：0，他引：35

吴昊杨梅英陈良猷《系统工程理论与实践》2004,24(2):90-94

从博弈参与人的有限理性出发,探讨了合作竞争博弈中复杂性存在的根源,在此基础上应用演化博弈论的方法探讨了合作竞争博弈的演化模型,这是一个复制动态模型,因而我们可以借用生物学中的"复制动态"机制来模拟参与人的学习与调整机制,用"进化稳定策略"来描述合作竞争博弈的长期演化趋势,最后分析了一个水平差异化产品的合作竞争博弈的演化均衡与稳定性,及其演化过程中所表现出来的复杂性. 相似文献

11.

Dynamic Decision Model in Evolutionary Games Based on Reinforcement Learning

Wei-bing LIU Xian-jia WANG 《Systems Engineering - Theory & Practice》2009,29(3):28-33

In evolutionary games, it becomes more difficult to choose optimal strategies for players because of incomplete information and bounded rationality. For bounded rational players, how to maximize the expected sum of payoffs by learning and changing strategies is an important question in evolutionary game theory. Reinforcement learning does not need a model of its environment and can be used online, it is well-suited for problems with incomplete and uncertain information. Evolutionary game theory is the subject about the decision problems of multiagent with incomplete information. In this article, reinforcement learning is introduced in evolutionary games, multiagent reinforcement learning model is constructed, and the learning algorithm is presented based on Q-learning. The results of simulation experiments show that the multiagent reinforcement learning model can be applied successfully in evolutionary games for finding the optimal strategies. 相似文献

12.

企业应急物资轮换更新行为与政府监管博弈分析

张琳田军党创寅冯英杰《系统工程理论与实践》2018,38(10):2611-2619

政府作为社会安全和社会福利保障的责任者,需要监管企业合规储备和轮换更新应急物资与设备的行为,但常常因为受制于企业储备信息不透明而导致监管效果不理想.本文针对应急物资周期性轮换更新这一敏感问题,建立了政府和企业的博弈模型,分析了一类质量或性能随时间下降的应急物资和设备按期轮换更新行为的监管策略,采用基于经验学习的强化学习算法求得政企博弈均衡解.算例分析结果验证了经验学习方法解决这一类问题(道德风险问题)的有效性.通过对比分析不同社会损失水平下的企业轮换更新行为和政府监管模式,进一步提出了相应的应对措施,从而对于这一问题的有效解决,提供了较好的管理启示. 相似文献

13.

基于GA-RL的进化博弈求解主从博弈结构的供应链协调问题 总被引：3，自引：2，他引：1

赵晗萍蒋家东冯允成《系统工程理论与实践》2010,30(4):667-672

供应链协调问题多数基于主从博弈结构建模,但如果研究对象是相对复杂的供应链结构.理论求解主从博弈问题就变得困难.因此从求解一对一的供应链协调问题开始,针对主从博弈问题的特点,利用个体学习的进化博弈仿真手段,设计了经销商利用经验分布的预期随机需求的信念更新模式与最优反应的决策模式,为生产商分别设计了基于强化学习的信念更新模式与基于遗传算法搜索策略空间的决策模式,并将两者有机结合,取得了博弈问题的均衡解并且验证该解与理论求解结果一致,为进一步求解复杂问题提供了新的途径. 相似文献

14.

基于径向基函数网络的强化学习在机器人足球中的研究 总被引：2，自引：1，他引：1

罗青李智军 Iqbal Nadeem 吕恬生《系统仿真学报》2002,14(8):1094-1097

与监督学习从范例中学习的方式不同，强化学习不需要先验知识，而是具有从经验中学习的能力，将强化学习应用在大状态空间中，必须应用函数逼近的方法，如使用径向基函数网络建立输入和输出的映射关系。本文对基于径向基函数网络的强化学习在机器人足球这样的动态的多智能体环境中的应用进行了研究。实验结果证明了研究方法的可行性。相似文献

15.

气候变化下适应性治理的学习模式研究——以哈密地区水权转让为例

邓敏王慧敏《系统工程理论与实践》2014,34(1):215-222

适应性治理是应对社会生态系统复杂性和不确定性的新途径. 它从“学习”能力的角度考察个体行为决策特征和治理路径. 本文基于Experience Weighted Attraction (EWA) 理论和系统动力学分析影响人类行动选择和决策的因素,并融合社会学习和行为博弈理论设计水资源适应性治理下多回路、多层面的EWA演化学习模式,以应对气候变化等不确定性因素的影响. 同时结合哈密地区水权转让实例,通过仿真分析模拟适应性治理下行动主体(工业和农业)在水权转让中的行动选择规律,发掘促进主体行动概率改善的影响因素,形成水资源适应性治理的学习规则,并在学习规则指导下进行的适应性的政策调整,更好地促进水权转让实现和持续. 相似文献

16.

基于RDEU理论的n人非期望效用博弈模型及其应用 总被引：1，自引：0，他引：1

熊国强《系统工程》2008,26(6)

分析了经典博弈论理性行为假设的局限性,基于RDEU理论提出了新的n人非期望效用博弈模型,给出了其纳什均衡的定义和存在性的相关定理.通过"夫妻之争"博弈问题的实例分析,揭示了博弈问题的纳什均衡与局中人的偏好态度相关,表明了该模型的有效性. 相似文献

17.

公平与效率中的“公平偏好”：信息与记忆效应

朱晓武李粮生闫妍樊京芳陈晓松《系统工程理论与实践》2013,33(12):3139-3144

“公平偏好”是正确处理公平与效率之间关系的一个重要理论，近年来是实验经济学研究的热点问题.由于它与“理性人“假设的矛盾，所以较难纳入到经典经济学的理论分析框架.本研究在经典经济学理论假设下逐步引入信息和记忆效应，构建双盲最后通牒博弈模型、分配者策略模型和动态交互博弈模型，通过计算机模拟进行检验.动态交互博弈模型的计算机模拟产生非零的分配比率，与以往文献中的现场实验结果和现实情况吻合，表明公平偏好与信息和记忆效应有内在联系，即在经典经济学的基本框架下引入信息和记忆效应可导出公平偏好，由此搭建了经济学理性人假设与公平偏好的桥梁. 相似文献

18.

基于EWA学习的共享资源捐赠习俗演化仿真研究

宋妍《系统科学学报》2013,(4):78-81

针对个体策略学习可能对共享资源捐赠习俗演化路径产生影响,提出用EWA学习模型刻画个体在现实场景下的策略调整过程,建立多个体EWA学习的演化博弈模型,并基于EWA学习给出算法流程,进行计算机仿真实验。仿真结果表明,在EWA学习支配下,随着迭代期次的增加,供给策略对个体的吸引度越来越大,个体的平均支付及联合支付也相对较高,能够克服共享资源供给上的囚徒困境,使共享资源捐赠习俗发育成为可能。相似文献