首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于强化学习的沥青路面长期性能养护决策方法
引用本文:侯明业,王晓阳,徐青杰,杨博,王笑风.基于强化学习的沥青路面长期性能养护决策方法[J].山东科学,2023(3):108-114.
作者姓名:侯明业  王晓阳  徐青杰  杨博  王笑风
作者单位:河南省交通规划设计研究院股份有限公司
摘    要:针对道路长期性能养护决策中庞大的数据分析问题,将深度确定性策略梯度(deep deterministic policy gradient, DDPG)强化学习模型引入到了养护决策分析中,将道路性能的提升及养护资金的有效利用作为机器学习的奖励目标,建立了一套科学有效的沥青路面长期性能养护决策方法,经过与DQN(deep Q-learning network)算法和Q-Learning算法进行对比,DDPG算法所需要的采样数据更少、收敛速度更快,表现更为优异,可有效提升道路服役性能的评估效率,对沥青路面多目标长期养护决策方案的制定起着重要的推动作用。

关 键 词:交通工程  沥青路面  养护决策  强化学习  深度确定性策略梯度模型
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号