首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 46 毫秒
1.
将预测分析技术和强化学习技术有机结合,使多Agent系统中的各Agent,不仅具有了高度反应自适应性,而且拥有了高效而准确的预测分析能力;使Agent的行为更具有针对性,尽可能地减少错误,保证学习的正确方向,提高Agent间进行信息共享,融合单个Agent的Q值表.相当于相同情况下增加了学习次数,不仅尽可能地消除策略中的冗余动作,以高效的方式实现最终目标,而且提高多Agent系统执行效率和收敛速度及性能.本文提出了一种改进的多Agent间协作学习方法,适用于环境不完备的复杂情况.以追捕问题作为仿真实验.结果表明所提方法能够有效地促进多智能体系统中各Agent间协作学习能力.  相似文献   

2.
路畅  ;杨世欣 《科技信息》2008,(33):192-192
本文提出基于环境感知的具有推理能力的BDI Agent模型。通过引入环境感知函数、意见函数、过滤函数、行为函数对环境的变化和Agent自身推理过程进行研究。  相似文献   

3.
通过对BDI属性的刻画让Agent个体理智行为是多Agent系统中研究的一个重要方向.为了在开放系统中理智行为,模型在传统BDI逻辑的基础上结合了ATL语言中的一些概念.进一步地,为了体现Agent个体的自主性,分别定义了环境状态转换函数与私人状态转换函数.在该框架中,Agent个体通过一些必要的步骤,就可以适应环境,计算出更有助于自己达到目标的策略.  相似文献   

4.
从认知的和社会的角度分析了协同设计活动,提出了一种面向协同设计的多Agent系统结构和设计Agent的感知模型,以及多Agent协同强化学习的方法.该方法采用动态小生境技术对设计Agent进行分组,并选出每组中的最优设计Agent,使其通过与设计人员交互进行强化学习,然后和其他组选出的Agent协同学习,并把学到的知识在组内进行传播.以齿轮减速器设计为例,介绍了多Agent协同设计系统的协同设计及学习过程.  相似文献   

5.
赵国荣 《科技信息》2008,(35):186-187
本文分析了Agent的信念、愿望、意图模型(BDI模型)。依据BDI模型结构,本文刻画了Agent的内部状态,主要涉及Agent的信念、愿望和意图等思维属性,使该模型既能描述客观环境,又能描述Agent的思维状态及其变化过程。  相似文献   

6.
Agent技术特别是多Agent系统MAS(Mutil-Agent system)为解决人工智能等领域复杂问题提供了一个新途径.以MAS等理论为指导,结合Agent强化学习的基本原理,提出一种基于多Agent系统的偏好学习模型.该模型可以应用于针对用户偏好的互联网搜索中,对提高信息检索的查准率有一定帮助.  相似文献   

7.
AODE中基于强化学习的Agent协商模型   总被引:10,自引:2,他引:8  
AODE是我们研制的一个面向Agent的智能系统开发环境。AODE中基于强化学习的Agent协商模型采用Markov决策过程和连续过程分别描述系统状态变化和特定系统状态的Agent协商过程,并将强化学习技术应用于Agnet协商过程。该协商模型能够描述动态环境下的多Agent协商,模型中所有Agent都采用元对策Q-学习算法时,系统能获得动态协商环境下的最优协商解。  相似文献   

8.
针对电梯群控系统这一类复杂的派梯优化决策问题,应用多Agent的理论与技术,建立了系统强化学习模型.提出了一种基于GA算法的多Agent强化学习方法,给出了具体算法的一般描述.建立电梯群控调度系统的虚拟仿真环境,并与其他算法进行了对比研究.仿真结果表明:该方法在提高强化学习的效率和收敛速度,改善种群结构等方面收到了很好的求解效果,为电梯群控系统的优化调度决策提供了一种较好的途径.  相似文献   

9.
针对将单AgentQ-学习协作算法直接扩展到多Agent系统会导致状态-动作对集合的急剧膨胀、从而影响多Agent的协作学习速度的问题,提出了基于实用推理的多Agent协作强化学习算法.在实用推理框架下,首先在慎思过程中通过考虑群体意图来确定单个Agent的子意图;然后,在手段-目的推理过程中采用Q-学习算法得出实现子意图的最优策略,从而实现群体意图.在Q-学习算法中,各Agent只需考虑自身的状态-动作的值函数更新,对其他Agent值函数的更新可以不加考虑,从而大大降低了算法的空间复杂度,提高了学习速度.追捕问题的仿真实验结果验证了算法的有效性.  相似文献   

10.
借助于组织学思想,将自适应系统中的自主运行单元抽象为Agent,把复杂自适应系统视为多Agent组织,从时间和状态角度,对复杂动态系统的行为进行描述。提出了基于时序活动逻辑的多Agent动态协作任务求解自适应机制和构造模型;详细分析了任务求解BDI Agent的信念、愿望、意图的产生过程和实现方法;深入讨论了协商推理的语义规则和行为规则;给出了协作群组的选择算法,包括从群组的建立、选择任务Agent、分解和分配子任务;从任务求解Agent的心智变化角度,详细描述了动态协作任务求解模型实现的6个阶段:任务动态分配、协作意愿产生、协作群体生成、共同计划制定、协作群体行动和结果评估。通过在MAGE等平台上的实验和仿真测试,验证了方法的可行性和有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号