首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
交互式动态影响图是一种以动态影响图为基础,利用有向图构造Agent之间交互作用的决策概率模型,目前只能解决2个Agent的问题.根据概率图模型理论、交互式部分可观测马尔可夫决策过程性质、最大奖励期望值原理等以3个Agent为例建立多Agent交互式动态影响图(I-MADIDs)模型,探讨除建模Agent之外,其他非建模Agent之间存在稳定关系时,如何简化I-MADIDs模型.最后对老虎问题进行建模,利用HUGIN7.0对其进行求解,分别讨论了建模A-gent和其他Agent的决策情况,对比了精确方法和简化模型中贝叶斯参数学习近似方法中Agent的决策情况,证明了近似方法的有效性.  相似文献   

2.
影响图是贝叶斯网络的扩展,利用影响图可以有效解决智能Agent利用经验学习和行为选择2个基本问题。RoboCup是一个典型的多Agent系统,其中的球和球员都可以看成是Agent。文章给出一种基于影响图的决策方法,并将其应用到RoboCup中,从而实现了球员截球过程中行为的动态调整。  相似文献   

3.
为了实现动态环境中Agents之间的有效协作,Agent必须能够识别其它Agent的模型.用影响图作为Agent模型表示工具,给定Agent的一个初始模型和它的历史行为,在能力、优先和信念学习的基础上来构建新的模型.学习的方法是用其它Agent的历史行为作为训练集,利用神经网络学习技术来修改效用函数.  相似文献   

4.
为了表示部分可观察马尔可夫环境下,多Agent决策中各Agent之间的动态结构关系,对影响图(IDs)在结构和时间上进行扩展,形成一种能够对其他Agent建模的决策模型:交互式动态影响图(I-DIDs).I-DIDs是不确定环境下多Agent进行序贯决策的图模型.该模型的解是在对其Agent行为概率分布的预测下提供给该...  相似文献   

5.
交互式动态影响图(I-DIDs)是不确定环境下多Agent序贯决策的图模型.该模型突破传统基于公共知识的纳什均衡点的假设,使得该模型具备解决大规模动态决策问题的能力,具有更为广泛的应用前景.在总结、分析动态影响图研究成果的基础上,针对多Agent的I-DIDs状态空间随时间片的增长呈指数级增长问题,提出了基于行为等价和动作等价的两种新型算法并进行算法分析;此外,探讨应用I-DIDs模型解决自动小车存取系统中的路径规划、避免环路死锁问题,扩展了I-DIDs的应用范围.  相似文献   

6.
机器人足球赛相关技术研究   总被引:1,自引:0,他引:1  
机器人足球赛是当前人工智能和机器人领域研究的热点之一,Robocup是在实时的动态的环境中进行的,为分布式系统和多智能体系统提供了一个测试平台,在介绍Robocup比赛环境的基础上,对多智能体系统进行了讨论,重点讨论了Asent结构与设计及多Agent协作、学习等相关技术。  相似文献   

7.
为了实现动态环境中Agents之间的有效协作,Agent必须能够识别其他Agent的模型。用影响图作为Agent模型表示工具,给定Agent的一个初始模型和它的历史行为.在能力、优先和信念学习的基础上来构建新的模型。学习的方法是用其他Agent的历史行为作为训练集.利用神经网络学习技术来修改效用函数。  相似文献   

8.
多Agent协作求解是分布武人工智能要研究的基本问题.分析了指挥Agent的结构特点,并基于指挥Agent概念提出一个新的协作模型,该模型利用指挥Agent对多Agent系统进行全局协作分配,协作申请分级处理,解决了传统协作模型中存在的模型与应用领域中有关只适用于静态环境的问题.  相似文献   

9.
结合前瞻搜索思想提出了一种判断模型近似行为等价的方法,首先通过比较候选模型的部分解(即策略树)判断模型近似行为等价,然后自上而下对近似行为等价模型进行快速聚类和修剪,利用代表模型将交互式动态影响图扩展成为平铺动态影响图,最后求解平铺动态影响图.算法减少了候选模型的存储空间和运行时间,提高了算法的效率.最后通过多Agent老虎问题及音乐会问题的实验验证了该方法的有效性.  相似文献   

10.
角色分配格中的特异元   总被引:1,自引:0,他引:1  
Agent组织是合作求解的Agent集合,它描述了Agent与其承担的角色之间的关系.本文主要讨论Agent组织中的角色分配问题,提出了一种考虑了Role与Agent的偏好因素的扩充的角色分配二部图的概念,并指出Agent的角色分配问题就是在扩充的角色分配二部图上构造一个二部图的完美匹配.在Agent组织中,由于Agent及其组织的管理者都具有智能性,虽然Agent及其角色都可以得到匹配,但有些匹配不具有稳定性,因此自利的组织管理者和Agent都会在利益的驱动下背叛对方,从而导致组织破坏.紧接着本文讨论了稳定的扩充角色分配二部图的完美匹配集合,并在其上构造一个强稳定关系,从而将稳定匹配集和强稳定关系构造成一个代数结构--角色分配格,并在该格上构造了两个运算,并分析了两个运算之间的关系,由此得出角色分配格是一个分配格.最后分析了角色分配格中的几类特殊元--最大元、最小元、补元及交不可约元,并指出任何一个角色分配格都存在最大元和最小元,从而角色分配格是一个有界格,但并不是任何元都存在补元,从而角色分配格不一定是布尔代数,但是在给定特定的偏好下,即在特定的扩充角色分配二部图上,角色分配格可以构成布尔代数.对于交不可约元来说,它的重要意义就在于角色分配格中的任何元都可以表示成一些交不可约元的交,从而所有的交不可约元构成的集合是稳定匹配集的一个完备集.本文的结论是:扩充的角色分配二部图是Agent组织中的角色分配模型,其上所有的稳定匹配在强稳定关系下构成一个角色分配格,该格是一个有界分配格,但不一定是布尔代数,该格中的所有元都可以用其中的交不可约元来构造,从而为快速求解角色分配格做好了理论上的准备.  相似文献   

11.
Agent技术特别是多Agent系统MAS(Mutil-Agent system)为解决人工智能等领域复杂问题提供了一个新途径.以MAS等理论为指导,结合Agent强化学习的基本原理,提出一种基于多Agent系统的偏好学习模型.该模型可以应用于针对用户偏好的互联网搜索中,对提高信息检索的查准率有一定帮助.  相似文献   

12.
面向虚拟组织的政策导向型自治、可控Agent模型   总被引:1,自引:0,他引:1  
针对传统BDI模型在虚拟组织应用中所存在的三点不足,本文提出了政策导向型Agent模型.模型以政策导向为手段,利用政策来约束Agent动机的生成,进而影响其意图与行为的产生,增强Agent的可控性.模型采用了分层政策结构,根据政策的所代表利益方的不同,将政策划分为组织层政策与个体层政策,以此来解决Agent个体行为与组织整体目标的冲突问题.基于扩展的可废止逻辑框架,政策被表示为Agent的动机(义务、愿望)生成规则,这为模型提供了一个线性计算复杂度的形式化理论.模型在保持Agent一定自治性的同时,增强了Agent在组织级别上的可控性.  相似文献   

13.
为了加强个体机器人的动作执行力和时机选择的准确率、提高动作执行效率,本文提出了双层世界模型的决策结构.在Robocup机器人足球比赛的仿真平台上观察分析了该模型下的动作执行效果,结果表明该结构能够满足决策对实时性的要求,解决了动作实现达不到决策预想效果的问题.  相似文献   

14.
城市交叉口 Agent间的多遇交互历史学习协调方法   总被引:2,自引:0,他引:2  
为信号控制的城市道路交叉口定义一个Agent结构模型,利用双人对策Nash平衡理论构建了城市交叉口Agent间的多遇交互模型,每一交叉口Agent与相邻交叉口Agent进行多次交互学习,根据选择策略获得的效用值来更新它的混合策略.利用记忆因子δ、学习概率α、交叉口交通流变化概率βi等参数分析了交叉口Agent间的循环学...  相似文献   

15.
用户助于Agent是帮助 用户或部分代替用户参与任务的软件Agent,该文在给出一个多Agent系统组织模型的基础上,根据模型中用户及用户Agent的分布特点,给出了用户Agent的基于精神状态的主要行为规则,以改善用户Agent的性能。该文还提出了一种合作伙伴的选择方法,该方法有利于提高完成任务的成功率。  相似文献   

16.
介绍了自适应Agent的能力模型,并在此基础上提出一种基于规划的能力选择和补偿方法.首先,定义了能力元模型,能力元模型表示了业务和信息系统的设计,包括目标、协作、能力、上下文;然后,提出一种来进行Agent能力协作的能力选择与补偿方法,该方法解决了多Agent能力与任务之间协作问题;最后,通过用AGVs模拟演示医疗垃圾运输系统验证了能力选择与补偿方法.  相似文献   

17.
针对现有下载方法的不足,提出了一个基于多Agent协作的下载模型.该模型根据协作规则,将下载任务智能、动态地分配给网络上多个Agent,利用多Agent协作快速、高效、灵活地完成下载任务.Agent的知识是在多Agent的协作过程中,通过学习自动产生、完善和优化的.同时,阐述了模型实现的关键技术及解决方案.  相似文献   

18.
试图对体育教练执教水平建立一个综合的数学评价模型,选择成就、能力和名望这三个关键因素作为模型的评价指标.用权衡胜率建立教练成就评价模型;建立函数来评价教练能力与相关因素(如教龄、比赛场数等)之间的关系;采用变异系数法建立教练名望评价模型.最终,运用TOPSIS分析法计算出对体育教练执教水平总的评价结果.在模型测试阶段,采用数据拟合和假设检验分别对运动项目的普适性和性别的普适性进行了测试.  相似文献   

19.
物联网中的实体大多以异构形式存在,解决异构问题是推进物联网发展的重要因素.为此,在分析了实体及实体上载到网络中信息的特点后,基于Agent提出一种异构实体关系服务模型.该模型具有实体信息数据处理和构建实体服务逻辑两种功能,利用提出的全新的实体物间动态关系计算公式将异构数据转化为物间关系紧密度(值),并依此生成了Agent服务序列,结合二分图理论实现物联网环境下的Agent服务逻辑;屏蔽了原本因实体和其信息的异构而使得其无法正常交互通信的缺点,实体通过模型中与之对应的Agent进行交互,并在已构建的服务逻辑下支配Agent;最后对该模型进行了仿真实验,结果表明其可满足物联网环境中的用户服务需求,在数据更新和服务准确率及冲突的处理上要优于传统的本体语义技术对异构问题的处理结果.  相似文献   

20.
为了实现技术准备过程的集成与协同,将多代理技术和模糊综合评判技术引入到技术准备过程中来.在分析系统业务过程的基础上,建立了基于多Agent的技术准备集成系统框架,该框架由管理Agent、功能Agent和信息Agent构成;提出了由功能适配器、工作引擎、知识库和外部接口构成的Agent模型,并设计了各Agent的内部功能结构,为了解决Agent之间的协同问题,给出了Agent之间的协作模型,并在研究模糊综合评判方法的基础上,设计了Agent之间的冲突消解算法.最后,通过一个应用实例验证了系统的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号