首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于DQN的异构测控资源联合调度方法
引用本文:薛乃阳,丁丹,贾玉童,王志强,刘渊.基于DQN的异构测控资源联合调度方法[J].系统仿真学报,2023,35(2):423-434.
作者姓名:薛乃阳  丁丹  贾玉童  王志强  刘渊
作者单位:1.航天工程大学 研究生院, 北京 1014162.航天工程大学 电子与光学工程系, 北京 1014163.中国人民解放军61646部队, 北京 100192
摘    要:以异构测控网资源联合调度为研究对象,提出一种基于强化学习的深度Q网络(deep Q network, DQN)算法。在充分分析异构测控资源联合调度问题特点后,用数学语言对影响问题求解的约束条件进行描述,建立了资源联合调度模型;从应用强化学习解决问题的角度,对求解的问题进行马尔科夫决策过程描述后,分别设计了2个结构相同的神经网络和基于ε贪婪算法的动作选择策略,并建立了DQN求解框架。仿真结果表明:基于DQN的异构测控资源调度方法较遗传算法能够找到调度收益更优的测控调度方案。

关 键 词:航天测控  异构测控资源联合调度  深度Q网络  调度收益  强化学习
收稿时间:2021-08-31

DQN-based Joint Scheduling Method of Heterogeneous TT&C Resources
Naiyang Xue,Dan Ding,Yutong Jia,Zhiqiang Wang,Yuan Liu.DQN-based Joint Scheduling Method of Heterogeneous TT&C Resources[J].Journal of System Simulation,2023,35(2):423-434.
Authors:Naiyang Xue  Dan Ding  Yutong Jia  Zhiqiang Wang  Yuan Liu
Institution:1.Graduate School, Space Engineering University, Beijing 101416, China2.Department of Electronic and Optical Engineering, Space Engineering University, Beijing 101416, China3.PLA 61646 Troops, Beijing 100192, China
Abstract:
Keywords:telemetry  track and command (TT&C)  joint scheduling of heterogeneous TT&C resources  deep Q network  scheduling revenue  reinforcement learning  
点击此处可从《系统仿真学报》浏览原始摘要信息
点击此处可从《系统仿真学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号