首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于WGAIL-DDPG(λ)的车辆自动驾驶决策模型
引用本文:张明恒,吕新飞,万星,吴增文.基于WGAIL-DDPG(λ)的车辆自动驾驶决策模型[J].大连理工大学学报,2022,62(1):77-84.
作者姓名:张明恒  吕新飞  万星  吴增文
作者单位:大连理工大学 工业装备结构分析国家重点实验室,辽宁 大连 116024;大连理工大学 汽车工程学院,辽宁 大连 116024;大连理工大学 汽车工程学院,辽宁 大连 116024
基金项目:国家自然科学基金资助项目(51675077);中国博士后科学基金资助项目(2015M5813292017T100178).
摘    要:优良的可靠性、学习效率和模型泛化能力是车辆自动驾驶系统研究的基本要求.基于深度强化学习理论框架提出了一种用于车辆自动驾驶决策的WGAIL-DDPG(λ)(Wasserstein generative adversarial nets-deep deterministic policy gradient(λ))模型.其中,基于驾驶安全性、稳定性的车辆行驶性能要求,对强化学习模型中的奖励函数进行了针对性设计;通过引入模仿学习有效提升了强化学习过程中的学习效率;通过合理的增益调度器设计,保证了从模仿学习到强化学习的平稳过渡.实验结果表明,在稳定性上,智能体偏离道路中线的程度一直在30%内波动;在安全性上,智能体与周边其他车辆的安全距离基本保持在10 m以上;在模型泛化性方面,智能体在许多未训练过的复杂弯道也能很好地完成安全、平稳的驾驶任务;与原始DDPG(deep deterministic policy gradient)算法相比,该模型在学习速度上提升了约3.4倍,说明所提出的模型在保证自动驾驶系统可靠决策的同时有效提升了强化学习的效率,进一步实验证明其适用于不同的驾驶条件.

关 键 词:自动驾驶决策  深度强化学习  模仿学习  深度确定性策略梯度算法

Decision model for automatic vehicle driving based on WGAIL-DDPG(λ)
ZHANG Mingheng,Lü Xinfei,WAN Xing,WU Zengwen.Decision model for automatic vehicle driving based on WGAIL-DDPG(λ)[J].Journal of Dalian University of Technology,2022,62(1):77-84.
Authors:ZHANG Mingheng  Lü Xinfei  WAN Xing  WU Zengwen
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
点击此处可从《大连理工大学学报》浏览原始摘要信息
点击此处可从《大连理工大学学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号