基于强化学习的沥青路面长期性能养护决策方法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于强化学习的沥青路面长期性能养护决策方法

引用本文：	侯明业,王晓阳,徐青杰,杨博,王笑风.基于强化学习的沥青路面长期性能养护决策方法[J].山东科学,2023(3):108-114.

作者姓名：	侯明业王晓阳徐青杰杨博王笑风

作者单位：	河南省交通规划设计研究院股份有限公司

摘要：	针对道路长期性能养护决策中庞大的数据分析问题，将深度确定性策略梯度(deep deterministic policy gradient, DDPG)强化学习模型引入到了养护决策分析中，将道路性能的提升及养护资金的有效利用作为机器学习的奖励目标，建立了一套科学有效的沥青路面长期性能养护决策方法，经过与DQN(deep Q-learning network)算法和Q-Learning算法进行对比，DDPG算法所需要的采样数据更少、收敛速度更快，表现更为优异，可有效提升道路服役性能的评估效率，对沥青路面多目标长期养护决策方案的制定起着重要的推动作用。
关键词：	交通工程沥青路面养护决策强化学习深度确定性策略梯度模型