基于协作式深度强化学习的火灾应急疏散仿真研究 |
| |
作者姓名: | 倪凌佳 黄晓霞 李红旮 张子博 |
| |
作者单位: | 1.中国科学院 空天信息创新研究院, 北京 1000942.中国科学院大学, 北京 1000493.自然资源部城市国土资源监测与仿真重点实验室, 深圳 518034 |
| |
基金项目: | 国家自然科学基金(41971363);自然资源部城市国土资源监测与仿真重点实验室开放基金资助课题(KF-2018-03-032);国家重点研发计划(2017YFB0503905) |
| |
摘 要: | 火灾是威胁公共安全的主要灾害之一,火灾产生的高温和有毒有害烟气严重影响了疏散路径的选择。将深度强化学习引入到应急疏散仿真研究,针对多智能体环境提出了协作式双深度Q网络算法。建立随时间动态变化的火灾场景模型,为人员疏散提供实时的危险区域分布信息;对各自独立的智能体神经网络进行整合,建立多智能体统一的深度神经网络,实现所有智能体之间的神经网络和经验共享,提高整体协作疏散效率。结果表明:所提方法具有良好的稳定性和适应性,训练和学习效率得到提升,具有良好的应用价值。
|
关 键 词: | 协作式双深度Q网络算法 深度强化学习 多智能体系统 应急疏散仿真 火灾场景仿真 |
收稿时间: | 2021-02-04 |
|
| 点击此处可从《系统仿真学报》浏览原始摘要信息 |
|
点击此处可从《系统仿真学报》下载免费的PDF全文 |
|