基于协作式深度强化学习的火灾应急疏散仿真研究期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于协作式深度强化学习的火灾应急疏散仿真研究

作者姓名：	倪凌佳黄晓霞李红旮张子博

作者单位：	^1.中国科学院空天信息创新研究院, 北京 100094^2.中国科学院大学, 北京 100049^3.自然资源部城市国土资源监测与仿真重点实验室, 深圳 518034

基金项目：	国家自然科学基金(41971363);自然资源部城市国土资源监测与仿真重点实验室开放基金资助课题(KF-2018-03-032);国家重点研发计划(2017YFB0503905)

摘要：	火灾是威胁公共安全的主要灾害之一,火灾产生的高温和有毒有害烟气严重影响了疏散路径的选择。将深度强化学习引入到应急疏散仿真研究,针对多智能体环境提出了协作式双深度Q网络算法。建立随时间动态变化的火灾场景模型,为人员疏散提供实时的危险区域分布信息;对各自独立的智能体神经网络进行整合,建立多智能体统一的深度神经网络,实现所有智能体之间的神经网络和经验共享,提高整体协作疏散效率。结果表明：所提方法具有良好的稳定性和适应性,训练和学习效率得到提升,具有良好的应用价值。
关键词：	协作式双深度Q网络算法深度强化学习多智能体系统应急疏散仿真火灾场景仿真
收稿时间：	2021-02-04

	点击此处可从《系统仿真学报》浏览原始摘要信息
	点击此处可从《系统仿真学报》下载免费的PDF全文