排序方式: 共有19条查询结果,搜索用时 15 毫秒
1.
多智能体深度确定性策略梯度(multi-agent deep deterministic policy gradient, MADDPG)算法是深度强化学习方法在多智能体系统(multi-agent system, MAS)领域的重要运用,为提升算法性能,提出基于并行优先经验回放机制的MADDPG算法。分析算法框架及训练方法,针对算法集中式训练、分布式执行的特点,采用并行方法完成经验回放池数据采样,并在采样过程中引入优先回放机制,实现经验数据并行流动、数据处理模型并行工作、经验数据优先回放。分别在OpenAI多智能体对抗、合作两类典型环境中,从训练轮数、训练时间两个维度对改进算法进行了对比验证,结果表明,并行优先经验回放机制的引入使得算法性能提升明显。 相似文献
2.
异构仿真网络是实况、虚拟和构造(live, virtual, and constructive, LVC)仿真的基础环境支撑,合理评估其可靠性在LVC仿真应用中具有重要作用。针对复杂网络可靠性评估难以获得精确解、效率不高的问题,提出一种考虑节点失效的LVC异构仿真网络蒙特卡罗评估方法。首先,基于异构网络自身特点及因子定理,对蜂窝网络和无线传感器网络进行等效转化;其次,运用可靠性保持缩减技术对转化的仿真网络进行缩减,提高算法效率和收敛速度;最后,依据不完全可靠节点转化原则,对简化网络可靠性进行蒙特卡罗模拟,实现LVC异构仿真网络连通可靠性的评估。计算结果表明,相比传统蒙特卡罗方法,所提方法在保证计算精度的同时,方差减小,运行负载较小,稳定性更好。 相似文献
3.
太阳能产业的具有经济体量大、存量价值高、内部需求强健的特点,将成为未来强劲的经济支柱性产业。但由于人才匮乏,制约了我国太阳能产业的发展。本文以支持产业发展扩大学生就业面为出发点,提出了在电气工程及其自动化本科专业中增设太阳能专业方向。 相似文献
4.
5.
平台级ABM方法及在多传感器仿真演示中的应用 总被引:1,自引:0,他引:1
为了开展未来战争系统作战运用的先期概念技术演示,利用Agent作为智能实体的特性,把战争系统各成员直接映射成相应的Agent,由此提出了平台级基于Agent的建模(ABM)方法.在给出各Agent的定义和工作原理的基础上,采用任务树分解法和产生式规则表达知识的形式,设计了作为仿真演示系统基本单元的Agent.以信息化战场多个情报侦察平台(即多传感器)为例,开发了仿真演示系统.仿真演示结果表明,该系统模型能实现信息化战场上战术分队情报侦察这一客观、动态、复杂、智能过程的分布式仿真. 相似文献
6.
介绍了大望远镜机架控制系统的特异性,分析了影响控制系统性能的非线性干扰.比较了两种鲁棒控制理论,指出H∞控制更适用于望远镜的机架伺服系统.基于H∞控制理论,将非线性摩擦转矩处理为标称系统的输出端乘法摄动,把克服非线性摩擦转矩的影响转化为提高系统对模型摄动的鲁棒性;同时也考虑了系统对风扰力矩的抑制能力.通过MATLAB编程得到了一个H∞速度控制器,仿真结果表明,该控制方案相比传统的PID控制有更高的鲁棒性及可以实现更高精度的跟踪与校正. 相似文献
7.
8.
9.
10.