首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   3篇
  免费   1篇
系统科学   2篇
综合类   2篇
  2024年   1篇
  2021年   1篇
  2017年   1篇
  2014年   1篇
排序方式: 共有4条查询结果,搜索用时 0 毫秒
1
1.
基于深度随机博弈的近距空战机动决策   总被引:1,自引:0,他引:1  
针对空战中作战信息复杂、难以快速准确地感知态势做出决策的问题,提出一种博弈论与深度强化学习相结合的算法。首先,依据一对一典型空战流程,以随机博弈为标准,构建近距空战中红蓝双方对抗条件下的双机多状态博弈模型。其次,利用深度Q网络(deep Q network, DQN)处理战机的连续无限状态空间。然后,使用Minimax算法构建线性规划来求解每个特定状态下阶段博弈的最优值函数,并训练网络逼近值函数。最后,训练完成后根据网络输出求得最优机动策略。空战仿真实验表明,该算法具有较好的适应性和智能性,能够有效地针对空战对手的行动策略实时选择有利的机动动作并占据优势地位。  相似文献   
2.
作为解决序贯决策的机器学习方法,强化学习采取持续的“交互-试错”机制,实现智能体(Agent)与环境的不断交互,从而学得完成任务的最优策略,契合了人类提升智能的行为决策方式。知识作为一种包含了经验、价值观、认知规律以及专家见解等要素的结构化信息,应用于强化学习可以有效提高Agent的学习效率,降低学习难度。鉴于此,本文以强化学习的基本理论为起点,对深度强化学习以及基于知识的深度强化学习研究成果进行了系统性的总结与梳理。  相似文献   
3.
为了分析水下声学无线传感器网络在受到干扰情况下的性能,介绍了影响网络性能的相关干扰因素,设计了物理层水声通信干扰模型,建立了基于频率相关的路径损耗和Ricean衰减的信道模型,研究了可作为网络连通标志的覆盖范围、端到端帧误差概率、功率和带宽需求之间的关系,分析了节点受同层其他节点通信干扰下的网络性能。通过仿真实验验证了所设计模型的可行性。实验数据表明,通过优化通信工作功率和节点密度,能够确保网络正常运行,提高网络的可靠性。  相似文献   
4.
民国时期我国最有声誉的历史学家是在南方执教的柳诒徵和在北方执教的陈垣、陈寅恪,此即“南柳北陈”现象。“南柳北陈”说最早出现于蔡尚思1935年发表的《学问家与图书馆》一文中,初指20世纪20年代末、30年代初的柳诒徵和陈垣。其后,继40年代“部聘教授”和首届“中央研究院院士”评选后,“二陈”中陈寅恪的名气逐渐赶上并超过陈垣,使得“南柳北陈”说的含义发生变化。新中国成立后,特别是20世纪70年代到90年代,经过钱穆、蔡尚思、苏渊雷、柳曾符、卞孝萱等人的评说,“南柳北陈”说逐渐由“指柳诒徵和陈垣”向“指柳诒徵和陈寅恪”演变,反映了新时代学术生态和学术评价的变化。  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号