首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
都市圈技术创新主体协同的演化博弈分析   总被引:1,自引:0,他引:1  
基于协同学视角和演化博弈理论,分析了都市圈技术创新主体协同的演化过程和内在机制.结果表明:在都市圈创新主体的协同合作过程中存在多重均衡;都市圈创新主体间的协同演化取决于都市圈创新系统的自组织演化机制,或政府的调控和约束机制;而最终哪种机制对协同演化起主导作用,受初始状态、博弈方长期的学习和策略调整等因素的影响.因此,需要构建都市圈创新主体之间的信任关系以及有约束力的协议,以建立都市圈创新主体之间长期、稳定的协同合作关系.  相似文献   

2.
为了克服单个agent知识的局限性,提高系统决策的可靠性,提出了一种基于D-S理论的多agent合作决策机制,并对多agent合作决策进行了定义和形式化描述.多agent合作决策划分为学习和决策两个阶段,学习阶段反馈信息的引入,使各agent根据正确的训练案例和修正公式实现了冲突消解,降低了合成计算的复杂度,改进了Dragoni等人的工作,较投票机制和加权多数算法具有更高的可靠性,实验结果验证了这一结论.  相似文献   

3.
分析了利他、公平、信任等因素对博弈过程中合作的影响,以典型的"gift-exchange博弈模型"为例,假设博弈方行为受到一些因素影响并且可以用启发式规则简单描述,通过对成员Agent内部的利他、公平、信任等属性和交互过程中启发式规则的设计和编程实现,使得博弈双方在博弈过程中不断学习和调整策略,形成最终达成一致的合作机制.利用多Agent系统平台--JADE对所提出的模型进行仿真,通过对实验数据的分析,揭示了在多Agent系统中利他、公平以及信任等因素对合作的影响,指出了这些因素在经济生活中的实际指导意义.  相似文献   

4.
为了提高网络的可控可管性,解决实际网络管理中不同博弈理论集成所面临的动态决策和系统控制问题,分析了基于典型博弈理论的网络控制模型的基本特性,讨论了主从博弈、非合作博弈和合作博弈3种典型博弈问题的相关性,提出了以非合作博弈为基础的网络控制模型,包括资源最优控制层面和服务最优控制层面,分别实现对网络设备资源和网络服务请求的控制.该模型在博弈求解中考虑了时间变量的影响以及博弈实体在博弈过程中动态关系的变化轨迹,从所有博弈者的动态策略及目标状态的基本关系来解决网络博弈问题,最终形成一个能整合网络各要素的控制系统,并通过建立该网络控制模型的基本状态空间方程证明了该模型协同控制均衡态的稳定性.  相似文献   

5.
交通网中,最大化车流量和最小化平均等待时间是每一个路口调度的目标.交通调度中,各路口与其它路口发生博弈关系.博弈过程中,相邻路口之间为使其自身利益最大化而存在一种策略间相互协调的约束.针对复杂的交通调度控制问题,基于多智能体多阶段博弈论对交通系统进行建模.考虑动态博弈交通环境的实际特征,进一步基于博弈的增强学习算法,提出一种以惩机制为约束条件的交通系统博弈策略的学习方法,最终使参与交通博弈的多个路口达到Nash均衡,从而得到交通系统的最优配时调度策略组合.实验验证了所提出方法的可行性和有效性.  相似文献   

6.
多传感器之间如何产生动态、鲁棒的适应性协作行为以完成共同的任务,是多传感器协作的主要研究内容之一;文章在基于行为的多传感器系统的基础七,设计了基于协同进化机制的多传感器协进化模型及其协进化决策算法,使系统在协进化机制的控制下能分布并行地协同进化各传感器基本行为策略库,形成传感器适应性的协作行为以完成共同的任务;最后通过对无人侦察机编队协作侦察移动目标的仿真实验表明,能够有效地解决多传感器之间的协同问题.  相似文献   

7.
研究多agent系统的学习行为对于智能系统的适应性是至关重要的.针对一类追求系统得益最大化的协作团队的学习问题,基于马尔可夫博弈的思想,提出了一种新的多agent协同强化学习算法.协作团队中的每个agent通过观察协作相识者的历史行为,依照马尔可夫博弈模型预测其行为策略,采用适合的行为探索策略,进而得出最优的联合行为策略.实验对该算法进行了验证,结果表明该算法是有效的.  相似文献   

8.
针对频谱分配过程中会出现用户间的干扰问题,提出了一种基于信道选择和自适应功率控制的动态频谱分配算法.该算法的基本思想是将认知用户间频谱的竞争转化为以信道选择为策略空间的博弈模型,通过调整发射功率和利用改进后的效用函数来选择最优的分配策略.实验结果表明:该算法在实现频谱动态分配的同时减小了对授权用户的干扰,提高了系统总吞吐量.  相似文献   

9.
多变量时间序列各变量间依赖性较强,数据变化趋势不明显,预测难度高.传统研究采用带门控机制的循环神经网络及变体进行预测,但序列间存在相互依赖关系,突变数据段建模预测不精确.基于信息熵,本文提出一种新的改进门控权重单元,利用信息熵技术量化数据序列的变化程度,动态调整权重矩阵刻画数据的变化趋势.基于4个公开数据集分别进行实验,实验结果表明新模型比传统循环神经网络模型具有更好的预测性能.  相似文献   

10.
运用博弈论相关知识,对产业技术创新联盟中企业与高校及科研院所双方的信任合作进行了一次性博弈和无限次重复博弈分析,在此基础上,引入政府这个外在环境因素,阐述了政府的介入对于企业和高校双方信任博弈的影响.分析结果显示,一次性博弈中,企业和高校都会选择“不信任”的帕累托低效均衡解;无限次重复博弈,企业和高校都会选择“信任”的帕累托最优均衡解,双方均走出了一次性博弈时的困境;而政府的介入,对于联盟成员具有非常显著的约束力,会影响博弈双方的策略选择.针对产业技术创新联盟在合作过程中存在的由于缺乏信任导致的联盟效率低、失败率高、稳定性不足等诸多问题,健全产业技术创新联盟内的信任机制对整个产业技术创新联盟高效运转至关重要.应当从法律基础建设、信用评价体系构建、政府介入等方面促进产业技术创新联盟信任机制的建立与完善.  相似文献   

11.
为提高混合动力汽车的智能化控制水平,进一步改善整车燃油经济性和动力性,提出一种多能源动力总成的多智能体协调控制方法.以并联式混合动力汽车为原型,建立动力总成部件子系统智能体模型,构建多智能体系统协调控制框架,根据不同工况模式对总成动力进行预分配,利用单智能体的智能行为和多智能体的协作能力解决车辆对复杂路况的自适应问题.在Cruise软件环境下对智能体控制系统和协调控制策略进行了仿真验证,结果表明,动力总成的多智能体协调控制策略正确可行,使混合动力汽车能根据不同工况自适应控制模式,进而对动力进行自适应匹配,能够改善整车燃油经济性和动力性.  相似文献   

12.
针对实体与网络渠道合作中存在的渠道信任问题,构建实体渠道主导下两者基于信誉的双渠道合作博弈模型,并在限定周期内对信誉值、销量、利润、抽查次数、作假次数等指标进行仿真分析。结果发现:当网络零售商难以选择实体零售商时,实体零售商对网络零售商信任降低,会通过惩罚权力对网络零售商加以控制,这将招致网络零售商弄虚作假来提高销量及利润;相反,当网络零售商可以自由选择实体零售商时,竞争机制得以有效发挥,并提升实体零售商对网络零售商的信誉感。  相似文献   

13.
基于多智能体的供应链协同机制研究   总被引:6,自引:0,他引:6  
文章讨论了基于多智能体的供应链框架 ,在框架中由智能体代表供应链上的企业 ,以智能体的方式强调供应链企业间的竞合机制 ,设计一种多智能体的供应链模型 ,研究智能体结构以及多智能体系统的组织方式和协调机制。  相似文献   

14.
分析了Agent和多Agent系统的结构模型后,根据反生化恐怖应急指控大型复杂分布式信息处理系统的特点,结合多Agent系统的结构模型,提出了系统的一种实现框架,并对当前几个典型的Agent开发平台进行了分析和比较,提出了利用ZEUS平台开发反生化恐怖多Agent应急指控系统的实现思路,并对系统实现中的系统运行逻辑、Agent通信机制和Agent协作机制等进行了分析和研究,提出了指挥Agent的具体的内部结构.  相似文献   

15.
分析了Agent和多Agent系统的结构模型后,根据反生化恐怖应急指控大型复杂分布式信息处理系统的特点,结合多Agent系统的结构模型,提出了系统的一种实现框架,并对当前几个典型的Agent开发平台进行了分析和比较,提出了利用ZEUS平台开发反生化恐怖多Agent应急指控系统的实现思路,并对系统实现中的系统运行逻辑、Agent通信机制和Agent协作机制等进行了分析和研究,提出了指挥Agent的具体的内部结构。  相似文献   

16.
基于多Agent和遗传算法的制造网格资源调度   总被引:1,自引:0,他引:1  
为了保障用户的多QoS要求,在制造网格资源调度中引入灵活健壮的协商机制和高效的资源调度算法尤显重要.为此提出基于多Agent的制造网格资源调度方法,运用合同网协议作为多Agent的协作协议并根据制造网格资源调度需求运用遗传算法作为资源优化组合的算法.综合应用多Agent开发工具JADE和遗传算法工具包JGAP进行模拟调度实验,证明了方法的有效性.  相似文献   

17.
基于Markov对策和强化学习的多智能体协作研究   总被引:4,自引:0,他引:4  
MAS的协作机制研究,当前比较适用的研究框架是非零和Markov对策及基于Q-算法的强化学习。但实际上在这种框架下的Agent强调独立学习而不考虑其他Agent的行为,故MAS缺乏协作机制。并且,Q-算法要求Agent与环境的交互时具有完备的观察信息,这种情况过于理想化。文中针对以上两个不足,提出了在联合行动和不完备信息下的协调学习。理论分析和仿真实验表明,协调学习算法具有收敛性。  相似文献   

18.
为了应对动态、多变环境给管理系统带来的复杂性,提出了基于分布式范型的多智能体框架.该框架由多个分布式智能体结点组成,结点间通过消息传递与会话机制来实现分布式的合作与协同.结点内的功能主体使用了基于信念机制的内核结构,使得每个结点在以目标驱动的方式展开各种诊断与恢复的同时,仍能以反应驱动的方式对环境的变化做出反应,从而高效地实现了本地适应性管理.通过一个网络资源管理实例的分析证明,在复杂、动态的环境下所提框架能有效地实现可扩展的适应性系统管理.  相似文献   

19.
一种基于信任的动态访问控制策略   总被引:2,自引:0,他引:2  
基于角色的访问控制模型(role-based access control,RBAC)被普遍认为是当前最具有潜力的访问控制策略,已成为信息安全等领域研究的热点之一,然而传统的RBAC模型不能完全适合网格环境下的访问控制。针对网格环境下传统的RBAC中资源共享的伸缩性和恶意行为问题,在传统RBAC模型的基础上引入信任管理技术,提出一种新的动态的访问控制方式。这种新型的访问控制方式根据用户所属的信任等级动态调整用户的角色,在信任计算中,采用一种基于忠诚度的信任计算方法。仿真结果显示,该访问控制方式能有效地遏制恶意行为,并且可以解决伸缩性问题。  相似文献   

20.
多Agent模式在制造系统信息化中的应用   总被引:5,自引:0,他引:5  
针对分散网络化制造的特点,将多Agent系统引入到分散网络化制造环境中.介绍了Agent和多Agent的概念,并研究在网络化制造环境中Agent和多Agent系统的结构特点及表现形式.讨论了多Agent系统的通讯交互机制和协作协商机制.最后,提出了分散网络化制造环境中多Agent系统研究应该集中注意的几个关键性问题,并对分散化环境中多Agent系统的研究作了展望.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号