期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

刘东杰赵津席阿行《科学技术与工程》2019,19(30):241-246

基于深度学习的端到端车辆控制器多是由二维卷积神经网络(2D convolutional neural netuark,2D CNN)训练得到的,因未考虑时间维度上的帧间运动信息,使得控制器的可解释性与泛化能力较差,而三维卷积神经网络(3D CNN)可以从连续视频帧中学习时空特征。深度确定性策略梯度强化学习(depth deterministic policy gradient,DDPG)常用于连续动作的控制优化,但DDPG算法仍存在采样方式不合理而导致的样本利用率低的问题。基于此,采用3D CNN与改进DDPG算法相结合的方法对车辆方向盘转角和速度进行预测。通过实车实验实现了车辆在所设置轨道上的自主驾驶,为基于深度学习和强化学习方法解决自动驾驶中的端到端控制问题提供了科学方法。相似文献

2.

具有机会约束的多阶段可信性M-AD投资组合优化

张鹏黄梅雨彭壁玉《华南师范大学学报(自然科学版)》2019,51(3):94-102

本文基于可信性理论,考虑交易成本、借贷约束、阈值约束和基数约束等现实约束,我们提出一种新的具有机会约束的多阶段可信性均值绝对偏差(M-AD)投资组合优化模型。该模型在给定的置信水平下,运用可信性均值和绝对偏差衡量资产的收益和风险,通过对终期财富的最优化实现投资者的预期收益。运用可信性理论,该模型被转化为确定型的动态优化问题。由于交易成本和基数约束的存在,该模型为具有路径依赖的混合整数动态优化问题。文章提出一种新的前向动态规划方法求解。最后,文章通过实证研究验证了模型和算法的有效性。相似文献

3.

隧道围岩稳定性及其支护作用分析 总被引：1，自引：0，他引：1

张顶立《北京交通大学学报(自然科学版)》2016,40(4):9-18

针对隧道设计中的围岩力学特性及其荷载效应、"支护-围岩"动态作用特点及支护结构体系的协同作用原理3个基本问题进行研究.首先基于对大量山岭隧道围岩变形监测结果的统计分析,指出围岩变形规律和基本特点,以隧道掌子面围岩变形加剧点、初期支护施作和围岩变形稳定作为3个关键节点对"支护-围岩"力学演化过程的作用特点进行分析.提出了"浅层围岩"与"深层围岩"组成复合围岩结构的新理念,对围岩失稳的动态特征进行阐述,并通过计算分析指出了隧道围岩失稳模式、失稳机理和失稳范围的确定方法.基于围岩失稳模式推导作用于支护结构的围岩荷载计算公式,它包括由浅层围岩确定的"给定荷载"和深层围岩传递的"形变荷载"两部分.建立支护结构体系的协同作用力学分析模型,分析了弹塑性条件下影响塑性区变化的关键因素,揭示了初步加固圈层与后续支护圈层的协同作用原理.研究结论对实现隧道工程的动态化、定量化设计和施工具有重要的指导意义. 相似文献

4.

基于深度强化学习的分布式能源系统运行优化

阮应君侯泽群钱凡悦孟华《科学技术与工程》2022,22(17):7021-7030

分布式能源系统凭借其高效、环保、经济、可靠、和灵活等特点成为我国能源未来发展的重要方向。目前我国的很多分布式能源系统经济效益较差,主要原因是能源系统没有良好的运行策略。本文提出一种基于深度强化学习的分布式能源系统运行优化方法。首先,对分布式能源系统的各个设备进行数学建模。深入阐述了强化学习的基本原理、深度学习对强化学习的结合原理及一种基于演员评论家算法的分布式近端策略优化(Distributed Proximal Policy Optimization, DPPO)算法流程,将分布式能源系统运行优化问题转化为马尔可夫决策过程(Markov decision process,MDP)。最后采用历史的数据对智能体进行训练,训练完成的模型可以实现对本文的分布式能源系统的实时优化,并对比了深度Q网络(Deep Q Network, DQN)算法和LINGO获得的调度策略。结果表明,本文提出的基于DPPO算法的能源系统调度优化方法较DQN算法和LINGO得到的结果运行费用分别降低了7.12%和2.27%,可以实现能源系统的经济性调度。相似文献

5.

高频数据下基于LSTM的协方差矩阵预测模型

下载免费PDF全文

包悦妍《重庆工商大学学报(自然科学版)》2022,39(6):65-70

协方差矩阵的建模与预测,对于金融风险管理、投资组合管理等至关重要。针对时间序列模型对高维变量预测精度较低的问题,利用长短记忆神经网络模型(LSTM),提出了基于深度学习的高频数据已实现协方差矩阵预测模型。利用金融高频数据得到已实现协方差矩阵,对其进行 DRD 分解,针对相关系数矩阵 R 进行向量化处理,利用向量异质自回归模型(HAR)预测已实现相关系数矩阵 R;针对已实现波动率矩阵 D,利用半协方差(semi covariance)思想,结合 LSTM 模型,得到已实现波动率矩阵 D 的深度学习预测模型,构建了 LSTM-SDRD-HAR 已实现协方差矩阵动态预测模型。 LSTM 模型和 HAR 模型能捕捉实际数据的长期记忆性,半协方差有利于捕捉金融数据的杠杆性。实证分析表明:相较于传统向量 HAR 已实现协方差矩阵预测模型,LSTM-SDRD-HAR 预测已实现协方差矩阵更为准确,基于 LSTM-SDRD-HAR 预测已实现协方差矩阵构造的有效前沿组合投资效果更佳。相似文献

6.

生产企业优化组合模式探索及计算机量化分析

朱国怀《贵州大学学报(自然科学版)》2002,19(2):154-160

运用系统工程学的思想及计算机的数据处理手段，对一般生产企业的生产结构最优化组合进行了较深入的研究并创建一个数学模型，得出了一般企业生产的优化组合模式，将其运用在实际运用中取得了较好的效果，为我们进一步深入地对企业模式的探索开拓了一个新的思路。相似文献

7.

缓存辅助移动边缘计算的任务卸载与资源分配联合优化策略

赵婵婵郭晓敏海晓伟李晨浩韩国英武文红《科学技术与工程》2023,23(9):3812-3819

为了减少资源受限的移动边缘计算场景下任务卸载和资源分配过程中的能量消耗,提出缓存辅助的动态卸载决策和计算、通信、缓存多维资源分配的联合优化策略。该策略根据任务流行度制定缓存服务,通过控制用户设备的发射功率优化通信资源分配,并结合计算卸载合理利用服务器的计算资源。提出最小化时延和能耗的均衡优化目标,设计基于深度强化学习的优化求解算法。最后,通过仿真实验验证所提策略的有效性,结果表明该策略在计算资源和缓存容量约束条件下能展现较优性能。相似文献

8.

基于季节性自回归积分滑动平均与深度学习长短期记忆神经网络的降水量预测

张丽婷李鹏飞庞文静惠雯秦孟晟《科学技术与工程》2022,22(9):3453-3463

降水量数据是一种非线性、非平稳的时序序列,传统的方法较难获取数据的变化规律,深度学习长短期记忆(long short-term memory,LSTM)能较好地处理多要素变量与降水量之间的非线性关系.利用扬州市区1960—2019年8种气象基本要素数据,采用传统季节性自回归积分滑动平均(seasonal autoreg... 相似文献

9.

机器学习在遥感影像分类中的应用

高昂唐世浩肖萌郑伟《科技导报(北京)》2021,39(15):67-74

概述了机器学习的主要方法及其在遥感影像的主要应用方向,涵盖环境生态遥感中机器学习技术的研究、应用情况及近年来的新进展。通过使用深度学习对FY-3C气象卫星资料进行积雪检测的应用实例,说明深度学习模型可以利用大数据的优势不断提高检测精度,在某些指标中取得了更优于传统机器学习的精度,可解决传统机器学习难以解决的一些问题,从而带动遥感应用模式的创新。相似文献

10.

一种电能计量设备运维作业动态优化模型及算法

唐若笠 方彦军《湖南大学学报(自然科学版)》2017,44(2):109-116

针对电网企业传统模式下运维作业所存在的任务分配不科学、路径规划不合理和无法实时响应动态需求等问题,提出了一种新的动态优化模型及求解算法.该模型能够对运维作业的任务点数量、实时路况、运维人员属性与数量、决策者偏好等外部条件予以实时动态响应,满足电网企业日常管理工作需求.此外,针对模型特点提出一种基于解空间分割的粒子群算法(PSO-SSD)进行运维作业路径优化.仿真实验表明,本文所提出的动态优化模型及PSO-SSD算法能够在不同问题规模下保持优良性能,实现电能计量设备运维作业的实时动态优化,有效提升电网企业管理工作效率. 相似文献

11.

基于无监督学习的实时公交动态调度的研究

陈深进薛洋欧勇辉《重庆邮电大学学报(自然科学版)》2019,31(2):191-199

针对广州智能公交调度的优化问题,提出一种基于无监督学习的实时公交动态调度算法,结合乘客利益和公交公司利益总体最优为目标,通过无监督学习方法学习到公交客流出行特征表达的提取,利用吸引子传播(affinity propagation,AP)聚类算法的优化数据集与支持向量机(support vector machine,SVM)的训练样本集相结合建立预测模型训练,运用公交线网发车间隔和加权系数的目标函数优化调度数学模型,将多源信息融合及多策略的实时公交动态调度算法引入到求解模型中,利用深度学习的异常突发事件分类检测方法实现调度优化模型的实时调整。实验结果表明,AP聚类算法程序运行耗时16 s、高峰发车间隔5 min,比遗传算法运行效率更高、时间间隔更精确,实例证明模型和算法具有实用性和可靠性。相似文献

12.

基于深度图强化学习的低轨卫星网络动态路由算法

汪昊冉泳屹赵雷王俊霞雒江涛张涛《重庆邮电大学学报(自然科学版)》2023,35(4):596-605

为了解决高移动性导致卫星网络路由难以计算的问题,融合图神经网络和深度强化学习,提出一种基于深度图强化学习的低轨卫星网络动态路由算法。考虑卫星网络拓扑和卫星间链路的可用带宽、传播时延等约束,构建卫星网络状态,通过图神经网络对其进行表示学习;根据此状态的图神经网络表示,深度强化学习智能体选择相应的决策动作,使卫星网络长期平均吞吐量达到最大并保证平均时延最小。仿真结果表明,所提算法在保证较小时延的同时,还能提升卫星网络吞吐量和降低丢包率。此外,图神经网络强大的泛化能力使所提算法具有更好的抗毁性能。相似文献

13.

基于深度学习神经网络和量子遗传算法的柔性作业车间动态调度

陈亮阎春平陈建霖侯跃辉《重庆大学学报(自然科学版)》2022,45(6):40-54

针对柔性作业车间动态调度问题构建以平均延期惩罚、能耗、偏差度为目标的动态调度优化模型,提出一种基于深度Q学习神经网络的量子遗传算法。首先搭建基于动态事件扰动和周期性重调度的学习环境,利用深度Q学习神经网络算法,建立环境■行为评价神经网络模型作为优化模型的适应度函数。然后利用改进的量子遗传算法求解动态调度优化模型。该算法设计了基于工序编码和设备编码的多层编码解码方案;制定了基于适应度的动态调整旋转角策略,提高了种群的收敛速度;结合基于Tent映射的混沌搜索算法,以跳出局部最优解。最后通过测试算例验证了环境-行为评价神经网络模型的鲁棒性和对环境的适应性,以及优化算法的有效性。相似文献

14.

Intelligent logistics system of steel bar warehouse based on ubiquitous information

《北京科技大学学报》2021,(8)

Internet of Things and artificial intelligence technology are the key elements of the intelligent construction of iron and steel production warehouse. This paper puts forward a whole set of intelligent scheme for bar warehouse crane for the guidance of metallurgical process engineering, including cluster rapid self-awareness technology of the smart crane, precise self-executing technique of crane with rigid-flexible hybrid structure, multi-body system kinematics model of the smart crane sling and the swing characteristics model at different azimuth, antiswing control technology based on the optimization objective function, the vehicle model recognition system based on lidar, and the clustering crane dynamic scheduling method based on multi-agent reinforcement learning. The complete intelligent logistics system of the bar warehouse has changed the original operation mode of the warehouse area and realized the unmanned operation and intelligent scheduling of the crane,which is of great significance for improving the production efficiency, reducing the production cost, and improving the product quality. 相似文献

15.

基于多智能体深度强化学习的空间众包任务分配

赵鹏程高尚于洪梅《吉林大学学报(理学版)》2022,60(2):321-331

针对现有空间众包中的任务分配大多只考虑单边、短期利益和单一场景的问题, 提出一种基于多智能体深度强化学习的空间众包任务分配算法. 首先定义一种新的空间众包场景, 其中工人可以自由选择是否与他人合作；然后设计基于注意力机制和A2C(advantage actor-critic)方法的多智能体深度强化学习模型进行新场景下的任务分配；最后进行仿真实验, 并将该算法与其他最新的任务分配算法进行性能对比. 仿真实验结果表明, 该算法能同时实现最高的任务完成率和工人收益率, 证明了该算法的有效性和鲁棒性. 相似文献

16.

RC刚架拱桥的板桁组合加固及动力特性

谢肖礼勾文鑫庞木林《华南理工大学学报(自然科学版)》2023,51(4):31-43

钢筋混凝土（RC）刚架拱桥常见的加固方法大多属于局部加强而非整体改造,因此对于改善结构受力性能的作用极其有限,难以满足我国现阶段公路交通荷载日益增大的需求。针对以上问题,文中首先提出了一种新型加固方法——板桁组合加固法,该加固方法在主梁两侧架设钢桁架,通过植筋、焊接、铺设钢筋网和浇筑混凝土等措施使钢桁架与主梁牢固连接,形成板桁组合结构,从而使结构受力从主梁受力体系转变成板桁组合受力体系,实现对结构受力的优化;然后,利用该方法对某刚架拱桥进行加固改造,通过有限元仿真模拟与桥梁动载试验,对该新型加固方法的有效性和实用性进行验证。结果表明：加固后结构自振频率有效提高;竖向刚度和承载力显著增大;结构一阶面内竖弯频率理论值较加固前提高80.5%,公路-I级荷载作用下加固后结构下挠值较加固前减小56.8%,混凝土构件应力水平较加固前减小10.9%～69.8%;该加固方法对结构的动力特性具有改善作用,加固后结构的竖向振动效应小于加固前且实测冲击系数远小于现行规范值,结构动力性能良好。相似文献

17.

基于深度强化学习的空中无人机基站资源分配与公平性研究

下载免费PDF全文

郭少雄宋志群李勇《河北科技大学学报》2024,45(1):44-51

为了提高无人机基站(unmanned aerial vehicle base stations, UAV-BS)为地面多用户服务时的数据速率,提出一种基于决斗深度神经网络(dueling deep Q-network, Dueling-DQN)的深度强化学习(deep reinforcement learning, DRL)算法。采用决斗网络(dueling network, DN)结构以克服动态环境的部分可观测问题,联合优化了UAV-BS的位置和下行链路功率分配,在更符合实际的空地概率信道模型中检验了Dueling-DQN算法的性能。结果表明,相较于对比算法,所提出的Dueling-DQN算法可以提供更高的数据速率和服务公平性,且随着地面用户数量的增大,算法的优势更加明显。Dueling-DQN算法可有效解决复杂非凸性问题,为UAV-BS的资源分配问题提供理论参考。相似文献

18.

反馈混沌遗传算法及其在约束优化中的应用

孙有发高京广张成科邓飞其《华南理工大学学报(自然科学版)》2007,35(1):19-23

针对现有遗传算法中普遍存在的早熟与收敛慢的问题,将混沌映射和后天强化学习策略引入到标准遗传算法中,提出了带反馈的混沌遗传算法.该算法通过混沌映射来保持演化群体良好的多样性;通过基于Baldwin效应的后天强化学习来克服纯粹的随机演化.对复杂约束优化问题--基准问题的数值实验验证了文中算法的高效性及鲁棒性. 相似文献

19.

基于深度强化学习的卫星动态功率控制技术

下载免费PDF全文

徐素洁胡欣王银王丽冰马仕君王卫东《解放军理工大学学报(自然科学版)》2022,1(2):13-20

随着用户数量和数据业务的显著增长,卫星通信系统需要更高的吞吐量和更大的容量.在有限的无线资源条件下,高通量卫星如何通过智能化技术手段灵活高效地动态分配无线资源,成为当前卫星通信领域亟待解决的难题.在灵活载荷的框架下,传统的启发式方法存在计算复杂度高的问题,难以满足未来高实时的卫星通信业务需求.为解决以上难题满足未来灵活... 相似文献

20.

深度学习与一致性表示空间学习的跨媒体检索

邹辉杜吉祥翟传敏王靖《华侨大学学报(自然科学版)》2018,(1):127-132

提出一种基于深度学习与一致性表示空间学习的方法,针对图像与文本2种模态,分别采用卷积神经网络模型和潜在狄利克雷分布算法学习图像的深度特征和文档的主题概率分布;通过一个概率模型将两个高度异构的向量空间非线性映射到一个一致性表示空间;采用中心相关性算法计算不同模态信息在此空间的距离.在Wikipedia Dataset上的实验结果表明:在单模态输入检索中,文中方法的平均准确率为38.43%,相比于其他方法有明显提高. 相似文献