期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王全武胡晓辉《科技咨询导报》2011,(9):253-254

将预测分析技术和强化学习技术有机结合,使多Agent系统中的各Agent,不仅具有了高度反应自适应性,而且拥有了高效而准确的预测分析能力;使Agent的行为更具有针对性,尽可能地减少错误,保证学习的正确方向,提高Agent间进行信息共享,融合单个Agent的Q值表.相当于相同情况下增加了学习次数,不仅尽可能地消除策略中的冗余动作,以高效的方式实现最终目标,而且提高多Agent系统执行效率和收敛速度及性能.本文提出了一种改进的多Agent间协作学习方法,适用于环境不完备的复杂情况.以追捕问题作为仿真实验.结果表明所提方法能够有效地促进多智能体系统中各Agent间协作学习能力. 相似文献

2.

关于BDI Agent的推理模型的研究

路畅 ;杨世欣《科技信息》2008,(33):192-192

本文提出基于环境感知的具有推理能力的BDI Agent模型。通过引入环境感知函数、意见函数、过滤函数、行为函数对环境的变化和Agent自身推理过程进行研究。相似文献

3.

一种在Multi—Agent系统中协调形成策略的框架

林耀海胡山立骆剑彬《广西师范大学学报(自然科学版)》2008,26(2)

通过对BDI属性的刻画让Agent个体理智行为是多Agent系统中研究的一个重要方向.为了在开放系统中理智行为,模型在传统BDI逻辑的基础上结合了ATL语言中的一些概念.进一步地,为了体现Agent个体的自主性,分别定义了环境状态转换函数与私人状态转换函数.在该框架中,Agent个体通过一些必要的步骤,就可以适应环境,计算出更有助于自己达到目标的策略. 相似文献

4.

多Agent协同设计系统学习机制

刘弘郑向伟王吉华《兰州大学学报(自然科学版)》2012,48(4):91-97

从认知的和社会的角度分析了协同设计活动,提出了一种面向协同设计的多Agent系统结构和设计Agent的感知模型,以及多Agent协同强化学习的方法.该方法采用动态小生境技术对设计Agent进行分组,并选出每组中的最优设计Agent,使其通过与设计人员交互进行强化学习,然后和其他组选出的Agent协同学习,并把学到的知识在组内进行传播.以齿轮减速器设计为例,介绍了多Agent协同设计系统的协同设计及学习过程. 相似文献

5.

Agent的信念、愿望、意图模型

赵国荣《科技信息》2008,(35):186-187

本文分析了Agent的信念、愿望、意图模型（BDI模型）。依据BDI模型结构,本文刻画了Agent的内部状态,主要涉及Agent的信念、愿望和意图等思维属性,使该模型既能描述客观环境,又能描述Agent的思维状态及其变化过程。相似文献

6.

多Agent系统的偏好学习模型构建

王浩《郑州大学学报(理学版)》2008,40(3)

Agent技术特别是多Agent系统MAS(Mutil-Agent system)为解决人工智能等领域复杂问题提供了一个新途径.以MAS等理论为指导,结合Agent强化学习的基本原理,提出一种基于多Agent系统的偏好学习模型.该模型可以应用于针对用户偏好的互联网搜索中,对提高信息检索的查准率有一定帮助. 相似文献

7.

AODE中基于强化学习的Agent协商模型 总被引：10，自引：2，他引：8

王立春高阳等《南京大学学报(自然科学版)》2001,37(2):135-141

AODE是我们研制的一个面向Agent的智能系统开发环境。AODE中基于强化学习的Agent协商模型采用Markov决策过程和连续过程分别描述系统状态变化和特定系统状态的Agent协商过程,并将强化学习技术应用于Agnet协商过程。该协商模型能够描述动态环境下的多Agent协商,模型中所有Agent都采用元对策Q-学习算法时,系统能获得动态协商环境下的最优协商解。相似文献

8.

基于GA-RL算法的多Agent电梯群控系统

张广明巩建鸣涂善东《华东理工大学学报(自然科学版)》2009,35(4)

针对电梯群控系统这一类复杂的派梯优化决策问题,应用多Agent的理论与技术,建立了系统强化学习模型.提出了一种基于GA算法的多Agent强化学习方法,给出了具体算法的一般描述.建立电梯群控调度系统的虚拟仿真环境,并与其他算法进行了对比研究.仿真结果表明:该方法在提高强化学习的效率和收敛速度,改善种群结构等方面收到了很好的求解效果,为电梯群控系统的优化调度决策提供了一种较好的途径. 相似文献

9.

基于实用推理的多智能体协作强化学习算法

《华中科技大学学报(自然科学版)》2010,(4)

针对将单AgentQ-学习协作算法直接扩展到多Agent系统会导致状态-动作对集合的急剧膨胀、从而影响多Agent的协作学习速度的问题,提出了基于实用推理的多Agent协作强化学习算法.在实用推理框架下,首先在慎思过程中通过考虑群体意图来确定单个Agent的子意图;然后,在手段-目的推理过程中采用Q-学习算法得出实现子意图的最优策略,从而实现群体意图.在Q-学习算法中,各Agent只需考虑自身的状态-动作的值函数更新,对其他Agent值函数的更新可以不加考虑,从而大大降低了算法的空间复杂度,提高了学习速度.追捕问题的仿真实验结果验证了算法的有效性. 相似文献

10.

复杂系统的MAS动态协作求解时序逻辑模型

下载免费PDF全文

蒋伟进蒋星军姚丽娜《解放军理工大学学报(自然科学版)》2012,(1):41-45

借助于组织学思想,将自适应系统中的自主运行单元抽象为Agent,把复杂自适应系统视为多Agent组织,从时间和状态角度,对复杂动态系统的行为进行描述。提出了基于时序活动逻辑的多Agent动态协作任务求解自适应机制和构造模型;详细分析了任务求解BDI Agent的信念、愿望、意图的产生过程和实现方法;深入讨论了协商推理的语义规则和行为规则;给出了协作群组的选择算法,包括从群组的建立、选择任务Agent、分解和分配子任务;从任务求解Agent的心智变化角度,详细描述了动态协作任务求解模型实现的6个阶段:任务动态分配、协作意愿产生、协作群体生成、共同计划制定、协作群体行动和结果评估。通过在MAGE等平台上的实验和仿真测试,验证了方法的可行性和有效性。相似文献