期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	3篇
免费	1篇

专业分类

系统科学	2篇
综合类	2篇

出版年

2024年	1篇
2021年	1篇
2017年	1篇
2014年	1篇

排序方式： 共有4条查询结果，搜索用时 0 毫秒

基于深度随机博弈的近距空战机动决策 总被引：1，自引：0，他引：1

马文李辉王壮黄志勇吴昭欣陈希亮《系统工程与电子技术》2021,43(2):443-451

针对空战中作战信息复杂、难以快速准确地感知态势做出决策的问题,提出一种博弈论与深度强化学习相结合的算法。首先,依据一对一典型空战流程,以随机博弈为标准,构建近距空战中红蓝双方对抗条件下的双机多状态博弈模型。其次,利用深度Q网络(deep Q network, DQN)处理战机的连续无限状态空间。然后,使用Minimax算法构建线性规划来求解每个特定状态下阶段博弈的最优值函数,并训练网络逼近值函数。最后,训练完成后根据网络输出求得最优机动策略。空战仿真实验表明,该算法具有较好的适应性和智能性,能够有效地针对空战对手的行动策略实时选择有利的机动动作并占据优势地位。相似文献

基于知识的深度强化学习研究综述

李晨溪曹雷张永亮陈希亮周宇欢段理文《系统工程与电子技术》2017,39(11):2603-2613

作为解决序贯决策的机器学习方法,强化学习采取持续的“交互-试错”机制,实现智能体(Agent)与环境的不断交互,从而学得完成任务的最优策略,契合了人类提升智能的行为决策方式。知识作为一种包含了经验、价值观、认知规律以及专家见解等要素的结构化信息,应用于强化学习可以有效提高Agent的学习效率,降低学习难度。鉴于此,本文以强化学习的基本理论为起点,对深度强化学习以及基于知识的深度强化学习研究成果进行了系统性的总结与梳理。相似文献

水下声学无线传感器网络的设计和性能分析

下载免费PDF全文

陈秋丽何明陈希亮黄亮王立辉《解放军理工大学学报(自然科学版)》2014,(4):306-320

为了分析水下声学无线传感器网络在受到干扰情况下的性能,介绍了影响网络性能的相关干扰因素,设计了物理层水声通信干扰模型,建立了基于频率相关的路径损耗和Ricean衰减的信道模型,研究了可作为网络连通标志的覆盖范围、端到端帧误差概率、功率和带宽需求之间的关系,分析了节点受同层其他节点通信干扰下的网络性能。通过仿真实验验证了所设计模型的可行性。实验数据表明,通过优化通信工作功率和节点密度,能够确保网络正常运行,提高网络的可靠性。相似文献

“南柳北陈”考论

陈希亮《镇江高专学报》2024,(1):6-11

民国时期我国最有声誉的历史学家是在南方执教的柳诒徵和在北方执教的陈垣、陈寅恪,此即“南柳北陈”现象。“南柳北陈”说最早出现于蔡尚思1935年发表的《学问家与图书馆》一文中,初指20世纪20年代末、30年代初的柳诒徵和陈垣。其后,继40年代“部聘教授”和首届“中央研究院院士”评选后,“二陈”中陈寅恪的名气逐渐赶上并超过陈垣,使得“南柳北陈”说的含义发生变化。新中国成立后,特别是20世纪70年代到90年代,经过钱穆、蔡尚思、苏渊雷、柳曾符、卞孝萱等人的评说,“南柳北陈”说逐渐由“指柳诒徵和陈垣”向“指柳诒徵和陈寅恪”演变,反映了新时代学术生态和学术评价的变化。相似文献