基于深度强化学习的机翼分离流场零质量射流控制 |
| |
引用本文: | 何贤军,华越,王依哲,彭江舟,陈志华,吴威涛.基于深度强化学习的机翼分离流场零质量射流控制[J].南京理工大学学报(自然科学版),2022(6):697-708. |
| |
作者姓名: | 何贤军 华越 王依哲 彭江舟 陈志华 吴威涛 |
| |
作者单位: | 1. 南京理工大学瞬态物理国家重点实验室;2. 南京理工大学中法工程师学院;3. 南京理工大学机械工程学院 |
| |
基金项目: | 中央高校基本科研经费(30919011401);;江苏省自然科学基金(BK20201302); |
| |
摘 要: | 为了降低机翼在飞行中受到的阻力,该文针对NACA0012翼型构建了基于双喷孔零质量合成射流的流动控制框架,利用深度强化学习(DRL)的近端策略优化(PPO)算法获取了一种具有环境实时适应性的主动流动控制策略。研究了不同来流条件下DRL流动控制策略对机翼边界层以及尾部流动分离情况的影响。探索了进一步考虑射流节能作为奖励函数的流动控制策略的学习与最终控制效果。针对DRL模型超参数开展了研究,对比分析了不同网络更新频率(5、10、20)和不同学习率(10-3、10-4、10-5)下流动控制模型的训练效率和控制策略效果。结果显示,通过DRL获得的流动控制策略显著地减小了机翼上表面边界层的厚度,实现了35%的减阻和33.7%的升阻比提升。DRL在复杂控制目标下依然能学习到有效的减阻增升策略,且射流能量节省近50%。较小的网络更新频率在训练初期能快速地提升训练效果,但在中后期存在奖励值不升反降,网络过拟合的问题。较大的网络更新频率和较小的学习率则存在训练效果提升缓慢,训练周期过长,学习效率低的问题。
|
关 键 词: | 深度强化学习 机翼分离流场 主动流动控制 射流控制 近端策略优化 机翼边界层 尾部 网络更新频率 |
|
|