首页 | 本学科首页   官方微博 | 高级检索  
     

基于逆向强化学习的装船时堆场翻箱智能决策
引用本文:张艳伟,蔡梦蝶. 基于逆向强化学习的装船时堆场翻箱智能决策[J]. 同济大学学报(自然科学版), 2021, 49(10): 1417-1425
作者姓名:张艳伟  蔡梦蝶
作者单位:武汉理工大学 交通与物流工程学院,湖北 武汉 430063
基金项目:国家自然科学基金(60904067)
摘    要:集装箱码头装船时堆场翻箱具有时序性与动态性,属于NP(non-deterministic polynomial)难问题。针对常见的顺岸式集装箱码头堆场,以最小化总翻箱次数为优化目标,考虑翻箱对装船连续性及效率的影响,基于马尔科夫决策过程构建装船时堆场翻箱模型,设计逆向强化学习算法。为验证算法的有效性,以随机决策为基准,将设计的逆向强化学习算法与码头常见规则决策、随机决策对比。结果表明,贝位堆存状态不佳时,常见的规则决策不一定优于随机决策;逆向强化学习算法可有效挖掘隐含专家经验,收敛至最小翻箱次数的概率更高,且不同堆存状态下均能更好地限制单次发箱的翻箱次数,可实现装船时堆场翻箱智能决策。

关 键 词:集装箱码头  堆场翻箱  智能决策  马尔科夫决策过程  逆向强化学习
收稿时间:2021-01-14

An Inverse Reinforcement Learning Method for Container Relocation in Container Terminal Yard During Loading
ZHANG Yanwei,CAI Mengdie. An Inverse Reinforcement Learning Method for Container Relocation in Container Terminal Yard During Loading[J]. Journal of Tongji University(Natural Science), 2021, 49(10): 1417-1425
Authors:ZHANG Yanwei  CAI Mengdie
Abstract:
Keywords:container terminal  yard relocation  intelligent decision-making  Markov decision processes  inverse reinforcement learning
点击此处可从《同济大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《同济大学学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号