深度强化学习在天基信息网络中的应用——现状与前景 |
| |
引用本文: | 唐斯琪,潘志松,胡谷雨,吴炀,李云波.深度强化学习在天基信息网络中的应用——现状与前景[J].系统工程与电子技术,2023(3):886-901. |
| |
作者姓名: | 唐斯琪 潘志松 胡谷雨 吴炀 李云波 |
| |
作者单位: | 1. 陆军工程大学指挥控制工程学院;2. 北京信息通信技术研究中心 |
| |
基金项目: | 国家自然科学基金(62076251)资助课题; |
| |
摘 要: | 未来天基信息网络(space information network, SIN)领域将面临由结构复杂、环境动态、业务多样等发展趋势带来的挑战。数据驱动的深度强化学习(deep reinforcement learning, DRL)作为一种应对上述挑战的可行思路被引入SIN领域。首先简要介绍了DRL的基本方法,并全面回顾了其在SIN领域的研究进展。随后,以星地网络场景的中继选择为例,针对大规模节点问题提出了基于平均场的DRL算法,并提出一种基于微调的模型迁移机制,用以解决仿真环境与真实环境之间的数据差异问题。仿真证明了其对网络性能优化的效果,且计算复杂度和时间效率均具有可行性。在此基础上归纳和总结了DRL方法在SIN领域的局限性与面临的挑战。最后,结合强化学习前沿进展,讨论了此领域未来的努力方向。
|
关 键 词: | 天基信息网络 深度强化学习 中继选择 网络性能优化 |
|
|