首页 | 本学科首页   官方微博 | 高级检索  
     

基于协作式深度强化学习的火灾应急疏散仿真研究
作者姓名:倪凌佳  黄晓霞  李红旮  张子博
作者单位:1.中国科学院 空天信息创新研究院, 北京 1000942.中国科学院大学, 北京 1000493.自然资源部城市国土资源监测与仿真重点实验室, 深圳 518034
基金项目:国家自然科学基金(41971363);自然资源部城市国土资源监测与仿真重点实验室开放基金资助课题(KF-2018-03-032);国家重点研发计划(2017YFB0503905)
摘    要:火灾是威胁公共安全的主要灾害之一,火灾产生的高温和有毒有害烟气严重影响了疏散路径的选择。将深度强化学习引入到应急疏散仿真研究,针对多智能体环境提出了协作式双深度Q网络算法。建立随时间动态变化的火灾场景模型,为人员疏散提供实时的危险区域分布信息;对各自独立的智能体神经网络进行整合,建立多智能体统一的深度神经网络,实现所有智能体之间的神经网络和经验共享,提高整体协作疏散效率。结果表明:所提方法具有良好的稳定性和适应性,训练和学习效率得到提升,具有良好的应用价值。

关 键 词:协作式双深度Q网络算法  深度强化学习  多智能体系统  应急疏散仿真  火灾场景仿真
收稿时间:2021-02-04
点击此处可从《系统仿真学报》浏览原始摘要信息
点击此处可从《系统仿真学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号