首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
基于智能体 (Agent)系统强化学习原理和基于动态规划的Q -学习算法的基础上 ,提出了一种新的Agent强化学习算法 .该算法在Agent学习过程中不断调整Agent知识库的加权值 ,在强化学习的每个阶段 ,通过选取合适的信度分配函数来修正Agent强化学习动作的选取策略 .与标准的Q -学习方法相比 ,具有更加合理的物理结构 ,并且能保证算法收敛 .仿真实验说明该方法加快了标准Q -学习算法的收敛速度 ,具有较好的学习性能  相似文献   

2.
为了解决用数学模型难以预测能源系统供需结构的问题,提出了基于多Agent的能源供需模型结构.定义各Agent抽象结构与具体实现,提供与各Agent任务匹配的控制方法与控制规则,构建基于多Agent的能源系统分层递阶结构,并在Simulink平台进行仿真.实验结果表明:多Agent方法建立的能源供需模型可有效地实现能源供需结构预测,可以为政府部门的能源规划和决策提供有力依据.  相似文献   

3.
基于Q-学习的动态单机调度   总被引:1,自引:0,他引:1  
针对当前基于Q-学习的Agent生产调度优化研究甚少的现状,利用Q-学习对动态单机调度问题在3种不同系统目标下的调度规则动态选择问题进行了研究.在建立Q-学习与动态单机调度问题映射机制的基础上,通过MATLAB实验仿真,对算法性能进行了评价.仿真结果表明,对于不同的系统调度目标,Q-学习能提高Agent的适应能力,达到单一调度规则无法达到的性能,适合基于Agent的动态生产调度环境.  相似文献   

4.
Agent技术特别是多Agent系统MAS(Mutil-Agent system)为解决人工智能等领域复杂问题提供了一个新途径.以MAS等理论为指导,结合Agent强化学习的基本原理,提出一种基于多Agent系统的偏好学习模型.该模型可以应用于针对用户偏好的互联网搜索中,对提高信息检索的查准率有一定帮助.  相似文献   

5.
一种自适应概率规划规则抽取算法   总被引:3,自引:0,他引:3  
在已知状态迁移条件下,利用传统概率规划技术能够获得确定的规划规则,而强化学习技术能够在未知环境条件下,利用试错和奖赏函数在线学习动态环境的策略知识。因此一种自适应的概率规划规则抽取算法被提出。该算法首先在强化学习获得的最优状态-动作对值函数基础上,通过迭代得到有折扣无奖赏的值函数和无折扣无奖赏的值函数。然后通过子规划剪枝将大于指定规划步数的子规划去除,并得到子规划剪枝后的状态-动作对值函数。最后通过Beam search算法从值函数中抽取满足概率规划条件的规划知识,从而在规划模型变化的条件下。也可以获得确定的概率规划规则。实验证明,这种自适应概率规划规则抽取算法是有效的。  相似文献   

6.
对多Agent系统的Q值强化学习算法进行研究,将历史信息因素的影响添加到Q值学习中,提出了一个新的基于多Agent系统的Q值学习算法.该算法在保证多Agent系统利益达到相对最大化的同时,也有效降低了Agent之间的冲突率.最后,通过仿真测试验证了该算法的有效性.  相似文献   

7.
针对将单AgentQ-学习协作算法直接扩展到多Agent系统会导致状态-动作对集合的急剧膨胀、从而影响多Agent的协作学习速度的问题,提出了基于实用推理的多Agent协作强化学习算法.在实用推理框架下,首先在慎思过程中通过考虑群体意图来确定单个Agent的子意图;然后,在手段-目的推理过程中采用Q-学习算法得出实现子意图的最优策略,从而实现群体意图.在Q-学习算法中,各Agent只需考虑自身的状态-动作的值函数更新,对其他Agent值函数的更新可以不加考虑,从而大大降低了算法的空间复杂度,提高了学习速度.追捕问题的仿真实验结果验证了算法的有效性.  相似文献   

8.
针对现有下载方法的不足,提出了一个基于多Agent协作的下载模型.该模型根据协作规则,将下载任务智能、动态地分配给网络上多个Agent,利用多Agent协作快速、高效、灵活地完成下载任务.Agent的知识是在多Agent的协作过程中,通过学习自动产生、完善和优化的.同时,阐述了模型实现的关键技术及解决方案.  相似文献   

9.
将个性行为绑定到信息Agent上,提出了一种基于个性的协同强化学习算法,让不同个性的Agent充当合适的角色.基于共同的目标和相同的信息,Agent可能产生共同的意图,规划出共同的行为,使得MAS可以适用于动态、实时、有干扰、对抗的环境中.  相似文献   

10.
基于Agent的工作流管理系统是目前CSCW领域研究的热点之一。结合传统的工作流模型,通过对规则的强化,改进了传统模型工作流的产生方式,推出了一种通过规则的推导产生工作流的工作引擎流,介绍了一种新的基于规则Agent的工作流引擎并给出了一个实际应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号