首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 609 毫秒
1.
针对知识化制造环境下的自适应调度问题,提出基于状态-动作不确定性偏向Q学习(state-action uncertainty bias based Q-learning,简称SAUBQ学习)的知识化制造自适应调度策略. 该策略针对传统Q学习收敛速度慢,训练时间长等问题,引入信息熵的概念定义了状态不确定性测度,据此定义了Q学习动作偏向信息函数,通过对Q学习奖励函数采用启发式回报函数设计,将动作偏向信息利用附加回报的方式融入学习系统,并证明了算法的收敛性和最优策略不变性. 在学习过程中,Q学习根据偏向信息调整搜索空间,减少了Q学习必须探索的有效状态-动作对数目,同时偏向信息根据Q学习结果不断进行调整,避免了不正确的误导. 经仿真实验比较,结果表明,该策略具有对动态环境的适应性和大状态空间下收敛的快速性,提高了调度效率.  相似文献   

2.
不确定条件下卫星鲁棒性调度问题   总被引:1,自引:0,他引:1  
在对地观测卫星调度过程中,存在着很多不确定性因素,其中云层覆盖变化是主要的不确定性来源。本文针对考虑云层覆盖不确定性的卫星调度问题,借鉴了连续函数的鲁棒性优化思想,提出了一种基于邻域的鲁棒性指标,用于衡量卫星调度方案的鲁棒性。在此基础上,建立了卫星鲁棒性调度的CSP模型,设计了基于分级优化策略的随机变邻域禁忌搜索算法。实例研究表明,本文提出的模型和求解算法能够在保证调度方案性能的基础上,获得鲁棒性强的调度方案。  相似文献   

3.
不确定环境下舰载机保障预反应式动态调度优化   总被引:1,自引:0,他引:1  
针对舰载机机务勤务保障过程中的不确定性和动态特性,研究舰载机保障预反应式动态调度优化问题。在预调度阶段设计双种群遗传算法,融合左右种群双向对齐迭代技术提高解的全局最优性,结合设定的保障期限求得带有工期保护缓冲的鲁棒性预调度方案。在反应性调度阶段,建立以最小化保障完工时间和最小化调度调整损失成本为目标函数的反应性调度模型,设计针对单一个体的自适应分层双目标变邻域优化算法,对预调度方案进行局部调整,优化反应性调度的效率和稳定性。提出5种不同反应性调度调整策略,对多种扰动类型下的不同保障机组的预调度方案进行局部调整和分析。为不确定环境下舰载机基准预调度计划的制定和反应性调度方案的调整提供了决策支持。  相似文献   

4.
施工进度计划柔性网络仿真的不确定性研究   总被引:14,自引:2,他引:12  
工程施工中应用柔性网络计算机仿真突破了传统的PERT只考虑单一关键线路的限制以及工序的持续时间均服从β分布的假定,也使得仿真工期与关键线路都具有了不确定性.一次仿真结果只相当于对系统模型的一次抽样,缺乏代表性.将网络计划仿真技术与风险分析技术结合起来,采用统计分析的方法确定仿真运行次数,对实际系统大量的动态仿真工期进行完工概率与风险分析,用"工序关键度"表征关键线路的概率分布结果,能够较好的描述施工进度计划的不确定性,为施工管理与决策提供更多的信息.  相似文献   

5.
A real-time dwell scheduling model, which takes the time and energy constraints into account is founded from the viewpoint of scheduling gain. Scheduling design is turned into a nonlinear programming procedure. The real-time dwell scheduling algorithm based on the scheduling gain is presented with the help of two heuristic rules. The simulation results demonstrate that compared with the conventional adaptive scheduling method, the algorithm proposed not only increases the scheduling gain and the time utility but also decreases the task drop rate.  相似文献   

6.
针对地面目标检测跟踪任务以多移动传感器系统为调度对象,提出一种考虑盲区的传感器调度方法。首先,建立了目标检测模型,基于贝叶斯风险理论给出了目标检测损失的计算方法以评估检测性能。然后,考虑多普勒盲区和视野盲区的影响,建立了目标跟踪模型,并给出了基于盲区信息辅助的目标跟踪算法以应对盲区出现时目标状态估计问题。最后,建立了传感器优化调度模型,结合检测损失、跟踪精度、传感器能耗等因素建立了目标优化函数。仿真结果表明,所提调度方法能够有效解决多移动传感器协同调度问题,所得的最优调度方案可在兼顾检测性能、跟踪性能和控制能耗的同时,使整体作战收益达到最佳。  相似文献   

7.
针对战时定点修理任务重、修理时间有限、约束复杂的问题,进行了面向定点修理的战时装备维修任务多目标动态调度研究。提出了战时定点修理装备维修任务调度军事问题,考虑修理时间窗、非遍历性等约束,构建了战时装备维修任务多目标动态调度模型。采取分步求解思路处理修理小组分配以及修理任务排序两阶段优化问题,并从状态转移规则、信息素更新规则、先验信息获取3个方面对最大最小蚂蚁系统(max-min ant system, MMAS)算法进行改进,结合变邻域搜索(variable neighborhood search, VNS)算法增强算法的局部搜索能力,设计了基于Pareto改进VNS-MMAS算法实现模型求解,并通过示例仿真验证了模型及算法的科学性与有效性。  相似文献   

8.
Reduction of conservatism is one of the key and difficult problems in missile robust gain scheduling autopilot design based on multipliers. This article presents a scheme of adopting linear parameter-varying (LPV) control approach with full block multipliers to design a missile robust gain scheduling autopilot in order to eliminate conservatism. A model matching design structure with a high demand on matching precision is constructed based on the missile linear fractional transformation (LFT) model. By applying full block S-procedure and elimination lemma, a convex feasibility problem with an infinite number of constraints is formulated to satisfy robust quadratic performance specifications. Then a grid method is adopted to transform the infinite-dimensional convex feasibility problem into a solvable finite-dimensional convex feasibility problem, based on which a gain scheduling controller with linear fractional dependence on the flight Mach number and altitude is derived. Static and dynamic simulation results show the effectiveness and feasibility of the proposed scheme.  相似文献   

9.
A search strategy based on the maximal information gain principle is presented for the cued search of phased array radars. First, the method for the determination of the cued search region, arrangement of beam positions, and the calculation of the prior probability distribution of each beam position is discussed. And then, two search algorithms based on information gain are proposed using Shannon entropy and Kullback-Leibler entropy, respectively. With the proposed strategy, the information gain of each beam position is predicted before the radar detection, and the observation is made in the beam position with the maximal information gain. Compared with the conventional method of sequential search and confirm search, simulation results show that the proposed search strategy can distinctly improve the search performance and save radar time resources with the same given detection probability.  相似文献   

10.
天基预警调度方法研究   总被引:2,自引:1,他引:1  
作为一种复杂多传感器跟踪任务, 天基预警过程可视作一种多维离散时间序列监控与预测问题. 预警任务具有高实时性、动态性、高低轨配合、多星协作等特点, 因而调度模型需能够优化利用预警资源完成有效预警. 本文从实际问题出发, 主要阐述两项工作: 第一, 提出基于信息增益的多目标优化预警调度模型, 第二, 阐述免疫克隆选择算法, 并给出一种分布式并行调度求解方法, 以改善调度算法的收敛速度和鲁棒性, 解决实际需要. 最后, 通过基于HLA的仿真系统, 以美国SBIRS为背景, 验证了本文调度模型和算法的有效性.  相似文献   

11.
基于CSP的Job shop调度算法研究   总被引:5,自引:0,他引:5  
针对一类典型的约束满足问题——Job shop调度问题,提出一种CSP调度算法框架,详细讨论CSP调度算法中的工序开始时间窗、一致性预处理、搜索空间概率模型、工序排序启发、开工时间排序启发的求解方法。仿真结果表明CSP调度算法在较小的计算时间代价下,获得了FT10标准调度问题的近优解。  相似文献   

12.
一种不确定条件下批处理过程的鲁棒调度模型   总被引:1,自引:0,他引:1  
批处理过程中存在大量的不确定因素,通常表现在参数的变化上,这使得确定性的生产调度模型难以得到令决策者满意的调度结果.为了解决这一问题,文章从鲁棒优化的角度出发,给出了鲁棒调度的新定义,其核心是在调度的可行性与最优性之间寻求均衡.介绍并提出了相关的鲁棒性指标来衡量调度的鲁棒性.并依据这种思想,针对不确定需求建立了一种新的鲁棒调度模型,该模型允许在一定程度上违背某些约束,但要求对这种违背进行补偿,规定补偿行为,并将补偿成本记入优化目标,从而实现鲁棒优化.仿真结果表明,利用该模型可以得到鲁棒性更强的调度方案,并且满足一定的最优性.  相似文献   

13.
突发事件应急救援具有高度的不确定性与动态性,稳定可靠的救援计划及其合理有效的动态调整,对于应急救援的顺利实施具有重要影响.本文以企业生产事故与突发事件为主要对象,研究应急救援的前摄性调度与反应性调度的集成优化问题.作者首先对问题进行界定,构建前摄性调度优化模型以求得一个鲁棒性最大的基准计划,然后以此为基础建立调整损失最小的反应性调度优化模型.针对问题的NP-hard属性,设计专门的禁忌搜索启发式算法.最后,通过对一个实际井喷事故救援过程的求解分析对研究进行说明,得到如下结论:前摄性调度的鲁棒性与反应性调度的损失值之间,并不存在一个绝对的单调关系,通过反复多次的求解运算,可以找到二者之间平衡点,实现两种调度方式的集成优化.本研究可为突发事件应急救援基准计划的制定与动态调整提供定量化决策支持.  相似文献   

14.
在Bayesian统计推理理论的基础上, 提出一种新的求解柔性车间调度问题的分布估计算法.首先, 根据所有工件的工序排列顺序提取进化过程中种群的优良信息, 建立一个不断更新的先验分布概率模型, 再以相邻工序出现的频率为基础建立条件概率模型; 然后, 结合两个模型的信息使用Bayesian公式建立一个后验概率模型, 该模型综合了进化过程中不断更新的优良信息和相邻工序出现的频率信息, 可用以更好地指导产生新群体.仿真结果表明算法具有较好的寻优能力.  相似文献   

15.
针对杂波环境下的多目标跟踪问题, 基于可移动主被动传感器系统, 提出了一种辐射控制的长时调度方法。首先, 建立调度模型, 对多目标运动状态和量测结果、传感器调度动作等进行数学描述; 同时, 基于雷达工作原理和截获概率的思想, 提出改进的辐射风险量化方法。随后, 利用高斯混合概率假设密度滤波算法预测长时跟踪精度, 利用所提改进的量化方法预测长时辐射代价, 并利用改进的灰狼优化算法求解传感器调度方案。最后, 执行调度方案获得多目标量测信息, 采用联合广义标签多伯努利滤波算法计算目标估计状态。仿真实验表明, 所提调度方法在保证跟踪精度的基础上, 能够实现对辐射代价的有效控制, 与其他方法相比具有明显的优势。  相似文献   

16.
面向应急需求的成像卫星单任务综合规划   总被引:2,自引:0,他引:2  
针对应急条件下成像卫星任务规划问题,在分析任务响应过程的基础上建立了面向任务需求的应急条件下单任务综合规划模型,模型以完成任务需求最早为优化目标,综合考虑了任务规划过程中卫星、测控及数传资源的分配,并提出了基于深度优先搜索的模型求解算法。算例分析结果表明,所提出的模型及算法有效,规划结果能够就现有卫星、测控及数传资源条件下,为应急成像任务需求提供星地资源调度解决方案。  相似文献   

17.
针对低轨星座目标连续跟踪的传感器资源调度问题,通过对调度约束因素的分析,提取跟踪精度、资源松弛度和资源分配均衡因子三个优化参数,建立了传感器实时调度模型;并建立长时调度决策树,将标准代价搜索方法和分支剔除技术相结合,提出了一种基于分支剔除的实时传感器调度算法。仿真实验表明,标准代价搜索和分支剔除技术的引入明显降低了调度算法的运算量,尤其对于多目标和大步长的情况,且调度传感器跟踪目标的误差略小于短时调度方法。  相似文献   

18.
在基于约束满足的Job Shop调度问题求解过程中,变量赋值顺序是影响搜索效率的关键因素.根据问题的约束拓扑关系,提出了变量的多级邻域结构模型,在此基础上构造了一种新的变量排序算法,通过引导当前搜索介入临界区域来提高计算效率.数值实验表明该算法能够有效地改善大规模Job Shop调度问题的求解效率.  相似文献   

19.
为了解决复杂多变战场环境下指挥控制(command and control, C2)组织资源调度敏捷性不足的问题,将Holonic控制理论引入C2组织的设计领域,研究Holonic-C2组织的资源调度问题。首先,对基于Holonic理论的C2组织Holon单元进行定义,给出Holonic-C2组织的基本结构;其次,对Holonic-C2组织的决策权限进行分析,给出决策模式的划分及确定方法;最后,研究在不同决策模式下Holon单元资源调度及针对不确定性事件的动态调度方法,建立集中与协作相结合的资源调度和调整机制。  相似文献   

20.
多无人机(unmanned aerial vehicle, UAV)协同搜索是多UAV协同一个重要研究方向。随着战场环境的复杂化,UAV对动态时敏目标的搜索显得尤为重要。针对动态时敏目标的运动特性,首先建立动态时敏目标的运动预测模型,为了降低由于目标运动造成的不确定性以及优化UAV的搜索性能,在采用贝叶斯理论对目标存在概率进行更新的基础上,研究了一种基于高斯分布的目标转移概率密度,通过计算得到动态时敏目标的存在预测概率,然后合理建立UAV协同搜索的性能指标函数,在分布式模型预测控制框架下,将多UAV集中式在线优化问题转化为各架UAV的分布式在线优化问题,最后对性能指标函数进行优化求解。通过仿真验证了所提方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号