排序方式: 共有13条查询结果,搜索用时 15 毫秒
1.
多智能体深度确定性策略梯度(multi-agent deep deterministic policy gradient, MADDPG)算法是深度强化学习方法在多智能体系统(multi-agent system, MAS)领域的重要运用,为提升算法性能,提出基于并行优先经验回放机制的MADDPG算法。分析算法框架及训练方法,针对算法集中式训练、分布式执行的特点,采用并行方法完成经验回放池数据采样,并在采样过程中引入优先回放机制,实现经验数据并行流动、数据处理模型并行工作、经验数据优先回放。分别在OpenAI多智能体对抗、合作两类典型环境中,从训练轮数、训练时间两个维度对改进算法进行了对比验证,结果表明,并行优先经验回放机制的引入使得算法性能提升明显。 相似文献
2.
3.
文章根据太原至长治高速公路第十六合同段舌道沟大桥,第十七合罔段西崖底中桥、武源河大桥,第二十合同段西河大桥,第二十二合同段涅河大桥,共5座大、中桥梁钻孔灌注桩施工实例,分析了桥梁钴孔灌注桩施工中常见的病害,并提出了预防措施和解决办法。 相似文献
4.
对石膏模-混凝土组合楼盖用磷石膏的抗压强度与含水率的关系、抗压强度取值、弹性模量取值、石膏与混凝土之间两类抗剪连接件受力性能进行了试验研究。研究结果表明,磷石膏的抗压强度随含水率的减小而增大,且随着含水率的降低,磷石膏的强度增加幅值越来越大,大致呈对数函数关系;磷石膏具有较好的抗压性能,其抗压强度较高,抗压强度可取4.8MPa,且受力过程中有明显的弹性阶段,根据曲线,其弹性模量取值约550MPa;对混凝土与石膏间的两类剪力连接件进行推出试验,结果表明两类连接件具有相同的抗剪强度,而B类连接件比A类连接件连接效果优越,试验数据比较稳定,最终以石膏破坏而导致构件破坏,连接件较为可靠。 相似文献
5.
本文对日本、韩国与我国在FDI(对外直接投资)中的目标市场选择进行了比较分析,认为我国目前在对外直接投资目标市场选择中出现的东南亚偏好现象是我国制造企业的理想选择,此外,提出了我国企业在目标市场选择中要注意的问题。 相似文献
6.
文章就面对外资银行的挑战和全球性的风险,如何控制风险、增加收益进行论述,说明资产证券化是一种已经被国外资本市场证明了的行之有效的风险控制手段. 相似文献
7.
8.
9.
本文通过对东西部地区高等教育现状的对比分析,认为西部高校的发展水平远远落后于东中部地区。教育投资有助于改善西部地区教育发展状况,有利于推动经济发展,鉴于我国现阶段西部高等教育投资资金不足,笔者提出几条解决思路。 相似文献
10.
真实-虚拟-构造为近距空战对抗训练提供了有力支撑。针对课题对蓝方虚拟实体的实际决策建模需求, 在对比分析深度强化学习与经典智能优化方法的基础上, 从优化理论的角度对神经网络的权值空间和结构空间进行定义, 提出基于智能优化的进化神经网络决策模型及其求解方法。首先,分析近距空战战术特点, 战机飞行运动模型, 实际决策建模需求。其次,分别设计战机关键飞行状态、动作空间、适应度函数, 实现蓝方端到端感知与决策。最后, 给出基于经典遗传神经网络的决策模型及求解示例。结果表明, 所提方法可实现蓝方战机通过对抗数据来学习对手作战特点的功能, 验证了模型及方法的有效性; 同时所提方法对目前智能优化及其改进算法, 以及不同结构神经网络具有通用性。 相似文献