期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	2篇
免费	0篇

专业分类

系统科学	1篇
综合类	1篇

出版年

2007年	1篇
2006年	1篇

排序方式： 共有2条查询结果，搜索用时 0 毫秒

基于平均报酬强化学习的电梯群组调度研究

宗群孙正雅宋超峰《系统仿真学报》2007,19(21):4945-4948

针对电梯群控系统,建立基于平均报酬强化学习的优化调度模型。采用R-learning的平均报酬强化学习求解算法,在分析电梯群组调度问题特点的基础上,利用径向基函数神经网络解决行为值函数的存储与泛化问题,并结合电梯群组虚拟仿真环境进行验证。通过与两种典型的电梯群组调度算法进行比较,展示了平均报酬强化学习算法在处理具有吸收目标状态的大规模随机序贯决策问题的有效性及可行性。相似文献

基于平均报酬模型的强化学习算法研究 总被引：1，自引：0，他引：1

黄炳强曹广益费燕琼王占全《上海理工大学学报》2006,28(5):418-422

对于有吸收目标状态的循环任务,比较合理的方法是采用基于平均报酬模型的强化学习.平均报酬模型强化学习具有收敛速度快、鲁棒性强等优点.本文介绍了平均报酬模型强化学习的3个主要算法:R学习、H学习和LC学习,并给出了平均报酬模型强化学习的主要应用及研究方向. 相似文献