期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

吴继伟萧蕴诗许维胜《同济大学学报(自然科学版)》2003,31(8):947-950

基于智能体 (Agent)系统强化学习原理和基于动态规划的Q -学习算法的基础上 ,提出了一种新的Agent强化学习算法 .该算法在Agent学习过程中不断调整Agent知识库的加权值 ,在强化学习的每个阶段 ,通过选取合适的信度分配函数来修正Agent强化学习动作的选取策略 .与标准的Q -学习方法相比 ,具有更加合理的物理结构 ,并且能保证算法收敛 .仿真实验说明该方法加快了标准Q -学习算法的收敛速度 ,具有较好的学习性能相似文献

2.

基于多Agent的能源供需模型

彭亦功俞金寿《华东理工大学学报(自然科学版)》2009,35(6)

为了解决用数学模型难以预测能源系统供需结构的问题,提出了基于多Agent的能源供需模型结构.定义各Agent抽象结构与具体实现,提供与各Agent任务匹配的控制方法与控制规则,构建基于多Agent的能源系统分层递阶结构,并在Simulink平台进行仿真.实验结果表明:多Agent方法建立的能源供需模型可有效地实现能源供需结构预测,可以为政府部门的能源规划和决策提供有力依据. 相似文献

3.

基于Q-学习的动态单机调度 总被引：1，自引：0，他引：1

王世进孙晟周炳海奚立峰《上海交通大学学报》2007,41(8):1227-1232,1243

针对当前基于Q-学习的Agent生产调度优化研究甚少的现状,利用Q-学习对动态单机调度问题在3种不同系统目标下的调度规则动态选择问题进行了研究.在建立Q-学习与动态单机调度问题映射机制的基础上,通过MATLAB实验仿真,对算法性能进行了评价.仿真结果表明,对于不同的系统调度目标,Q-学习能提高Agent的适应能力,达到单一调度规则无法达到的性能,适合基于Agent的动态生产调度环境. 相似文献

4.

多Agent系统的偏好学习模型构建

王浩《郑州大学学报(理学版)》2008,40(3)

Agent技术特别是多Agent系统MAS(Mutil-Agent system)为解决人工智能等领域复杂问题提供了一个新途径.以MAS等理论为指导,结合Agent强化学习的基本原理,提出一种基于多Agent系统的偏好学习模型.该模型可以应用于针对用户偏好的互联网搜索中,对提高信息检索的查准率有一定帮助. 相似文献

5.

多Agent系统的Q值强化学习算法

尚艳玲肖文雅《河南师范大学学报(自然科学版)》2013,41(2):158-160

对多Agent系统的Q值强化学习算法进行研究,将历史信息因素的影响添加到Q值学习中,提出了一个新的基于多Agent系统的Q值学习算法.该算法在保证多Agent系统利益达到相对最大化的同时,也有效降低了Agent之间的冲突率.最后,通过仿真测试验证了该算法的有效性. 相似文献

6.

一种自适应概率规划规则抽取算法 总被引：3，自引：0，他引：3

高阳陆鑫李宁陈世福《南京大学学报(自然科学版)》2003,39(2):145-152

在已知状态迁移条件下，利用传统概率规划技术能够获得确定的规划规则，而强化学习技术能够在未知环境条件下，利用试错和奖赏函数在线学习动态环境的策略知识。因此一种自适应的概率规划规则抽取算法被提出。该算法首先在强化学习获得的最优状态－动作对值函数基础上，通过迭代得到有折扣无奖赏的值函数和无折扣无奖赏的值函数。然后通过子规划剪枝将大于指定规划步数的子规划去除，并得到子规划剪枝后的状态－动作对值函数。最后通过Beam search算法从值函数中抽取满足概率规划条件的规划知识，从而在规划模型变化的条件下。也可以获得确定的概率规划规则。实验证明，这种自适应概率规划规则抽取算法是有效的。相似文献

7.

基于实用推理的多智能体协作强化学习算法

《华中科技大学学报(自然科学版)》2010,(4)

针对将单AgentQ-学习协作算法直接扩展到多Agent系统会导致状态-动作对集合的急剧膨胀、从而影响多Agent的协作学习速度的问题,提出了基于实用推理的多Agent协作强化学习算法.在实用推理框架下,首先在慎思过程中通过考虑群体意图来确定单个Agent的子意图;然后,在手段-目的推理过程中采用Q-学习算法得出实现子意图的最优策略,从而实现群体意图.在Q-学习算法中,各Agent只需考虑自身的状态-动作的值函数更新,对其他Agent值函数的更新可以不加考虑,从而大大降低了算法的空间复杂度,提高了学习速度.追捕问题的仿真实验结果验证了算法的有效性. 相似文献

8.

基于多Agent协作的下载模型研究

王丽侠梅成才《浙江师范大学学报(自然科学版)》2005,28(2):168-171

针对现有下载方法的不足,提出了一个基于多Agent协作的下载模型.该模型根据协作规则,将下载任务智能、动态地分配给网络上多个Agent,利用多Agent协作快速、高效、灵活地完成下载任务.Agent的知识是在多Agent的协作过程中,通过学习自动产生、完善和优化的.同时,阐述了模型实现的关键技术及解决方案. 相似文献

9.

基于个性的协同强化学习模型

严耀华程显毅张振文杨长隅《江南大学学报(自然科学版)》2007,6(6):714-717

将个性行为绑定到信息Agent上,提出了一种基于个性的协同强化学习算法,让不同个性的Agent充当合适的角色.基于共同的目标和相同的信息,Agent可能产生共同的意图,规划出共同的行为,使得MAS可以适用于动态、实时、有干扰、对抗的环境中. 相似文献

10.

一种基矛规则Agent的工作流引擎的研究

田巍王同保刘有才乔玮《科技情报开发与经济》2008,18(4):179-180

基于Agent的工作流管理系统是目前CSCW领域研究的热点之一。结合传统的工作流模型,通过对规则的强化,改进了传统模型工作流的产生方式,推出了一种通过规则的推导产生工作流的工作引擎流,介绍了一种新的基于规则Agent的工作流引擎并给出了一个实际应用。相似文献