基于近端策略优化的作战实体博弈对抗算法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于近端策略优化的作战实体博弈对抗算法

引用本文：	张振,黄炎焱,张永亮,陈天德.基于近端策略优化的作战实体博弈对抗算法[J].南京理工大学学报(自然科学版),2021,45(1):77-83.

作者姓名：	张振黄炎焱张永亮陈天德

作者单位：	南京理工大学自动化学院,江苏南京210094;陆军工程大学指挥控制工程学院,江苏南京210007

基金项目：	国家自然科学基金;装备预研项目

摘要：	针对一种大地图和稀疏奖励的兵棋推演对抗环境下,单纯的深度强化学习算法会导致训练无法快速收敛以及智能体对抗特定规则智能体胜率较低的问题,提出了一种基于监督学习和深度强化学习相结合以及设置额外奖励的方法,旨在提升智能博弈的训练效果.使用监督学习训练智能体;研究基于近端策略优化(Proximal policy optimiz...
关键词：	兵棋推演深度强化学习监督学习近端策略优化稀疏奖励
本文献已被 CNKI 万方数据等数据库收录！