首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
针对具有块角结构的大规模含整变量多目标决策问题提出了一种基于目标期望水平的交互多分解协调方法。该方法利用目标期望水平实现交互决策过程。利用拉格朗日分解对偶方法进行分解协协调。文中定义了若干概念,证明了若干定理,给出了交互决策的具体步骤,并对软件实现作了说明.  相似文献   

2.
近程反导舰炮武器系统射击效率评估   总被引:1,自引:0,他引:1  
近程舰炮武器系统担负着舰艇末端防空反导任务。提出了一种评估反导射击效率的方法,该方法选取了单目标毁伤概率、毁伤目标数学期望、服务概率作为射击效率指标。在确定舰炮武器系统有效射击区域的基础上,分析了反导可射击条件,研究了对单目标沿其航路射击的可射击时间、点射次数、受到各次点射的概率,利用经验公式得到单目标毁伤概率。然后,研究了多座舰炮对群目标射击时毁伤目标数学期望、服务概率两项评估指标的计算方法。实例计算分析表明该方法有效可行。  相似文献   

3.
战时可修复备件供应保障优化模型   总被引:1,自引:0,他引:1  
把战时备件供应保障看做一个多阶段过程,建立了典型三级备件供应保障结构下的战时备件供应保障规划模型,模型中采用阶段期望缺货数作为备件供应保障系统的性能参数,并给出了其定义及表达式。给出了通过迭代方法获得备件供应保障优化策略时阶段期望缺货数的计算过程,且考虑全部可修及部分可修两种情形。当供应渠道中备件数量服从Poisson分布时,基于动态Palm定理给出了期望缺货数的计算公式。最后给出一个数值计算实例。  相似文献   

4.
针对指标具有均衡性期望信息的多指标决策问题,提出了一种决策分析方法.首先,对指标具有均衡性期望信息的多指标决策问题进行描述;然后,针对决策者给出的指标期望信息,构建指标期望函数,进一步,通过计算每个备选方案与指标期望的偏差以及方案的综合评价值,得到备选方案的排序值,进而根据排序值得到方案的优选结果,最后给出一个算例,说...  相似文献   

5.
针对具有三种不同类型属性值,且属性期望以区间值和区间概率共同表达的随机多属性决策问题,提出一种考虑决策者后悔行为的决策分析方法.首先,分别计算不同属性下各方案带来的期望效用.然后,基于后悔理论,分别计算各属性下因未选择理想方案而带来的期望后悔值,并根据属性期望,得出各属性下因未达到或达到属性期望而产生的期望后悔欣喜值.进一步地,计算每个方案的期望综合感知效用值对方案进行排序和择优.最后以一个设备开发方案的选择为例,通过与其它方法的对比以及参数分析验证了所提方法的优越性.  相似文献   

6.
修理工单重休假可修系统优化管理研究   总被引:1,自引:0,他引:1  
针对修理工带有单重休假的单部件可修系统,提出了一种新的维修更换模型.假定系统是可修的,在系统逐次故障后的维修时间构成随机递增的几何过程,系统工作时间和修理工休假时间构成随机递减几何过程的情况下,选取系统的总工作时间T和故障维修次数N为更换策略,以长期运行单位时间内的期望效益为目标函数,通过更新过程和几何过程理论建立数学模型,分别导出了目标函数的解析表达式.还在一定条件下证明了策略N比策略T优,并通过数值例子验证了该方法的有效性.最后,还对结果进行了讨论.  相似文献   

7.
延迟修理的修理工多重休假可修系统更换模型   总被引:3,自引:0,他引:3  
针对有延迟修理的修理工多重休假单部件可修系统,提出了一种维修更换模型。系统发生故障时可能因修理工的休假或故障情况而得不到及时修理,因此系统可处于工作、修理和待修三种状态。假设系统每次维修后均不能“修复如新”和系统每次故障以概率1-p延迟修理的情况下,以系统的故障次数N为更换策略,通过扩展几何过程理论建立数学模型,求出了系统经长期运行单位时间内期望效益的明显表达式。最后,通过数值例子验证了该方法的有效性。  相似文献   

8.
为了优化ε不敏感支持向量回归机(ε-support vector regression, ε-SVR)的三类元参数,根据其耦合程度将其优化问题分解为核参数优化和结构参数(即不敏感参数和正则化参数)优化两个子问题,并提出了相应的优化方法。首先,提出了一种新的核校准系数以优化核参数;其次,提出了一种基于期望训练误差的结构参数优化方法;最后,为准确估算ε-SVR的期望训练误差,还提出了一种根据实际训练误差分布特征评估和校正期望误差的方法。仿真结果表明,该文方法具有与交叉检验法近似的优化效果,且时间效率更高。  相似文献   

9.
为了解决每个参与人恰有两个行动且极大熵准则以及每个参与人都完全不知道其他参与人的行动信息是全体参与人的共同知识的多人策略博弈的可能出现局势,给出了严格纯Nash均衡和期望均衡的求解法和最可能局势的分析法及其用应例子。以二进制和十进制数为基本工具,证明了严格纯Nash均衡的一个求解算法,基于全体参与人上述共同知识系统,给出了一个明显的期望均衡求解公式。通过设定参与人的效用为未知参数并根据期望均衡求解公式,由解不等式组的方法提出了期望均衡分析法。研究表明,此类常用博弈的特殊性致使两种均衡和期望均衡分析计算简洁。实例分析表明,此法可快速计算出博弈的严格纯Nash均衡和期望均衡,由期望均衡分析法给出的结论由传统方法无法得到且更加符合实际。  相似文献   

10.
针对物联网无人机通信中短突发连续相位调制(continuous phase modulation, CPM)盲均衡算法复杂度高、收敛差等问题,提出了一种基于期望最大化-维特比(expectation maximization Viterbi, EMV)的盲均衡算法。首先,将Lazy维特比算法嵌入到期望最大化(expectation maximization, EM)算法的迭代过程中,得到一种低复杂度的盲均衡算法;然后,基于盲信道捕获(blind channel-acquisition, BCA)方法构建了一组初值集,克服了算法对初值的敏感性,同时提升了信道估计的收敛性能。理论分析和实验结果表明,所提的盲均衡算法能够有效兼顾收敛性和计算复杂度,相比传统方法,在性能损失很小的条件下可大幅度降低计算成本,并且具有良好的鲁棒性。  相似文献   

11.
针对非线性退化设备的剩余寿命预测问题,尚未系统研究考虑测量误差和随机效应的退化建模、先验参数估计及相应的剩余寿命预测方法。首先建立考虑测量误差和随机效应的非线性Wiener退化模型;利用同类设备历史监测数据,基于期望最大化算法估计出退化模型中固定系数和随机系数先验分布;采用状态空间模型描述目标设备当前监测状态,基于Kalman滤波算法迭代估计出随机系数后验分布和当前真实退化状态;利用全概率公式,推导出考虑隐含状态估计不确定性的设备剩余寿命的概率密度函数;仿真实例分析表明,所提方法较现有方法在参数估计误差和剩余寿命预测精度上具有一定优势。  相似文献   

12.
敏捷后勤系统的分布式仿真体系结构   总被引:1,自引:0,他引:1  
针对敏捷后勤分布式仿真系统的构造需求,分析了仿真体系结构及系统描述方法的研究现状。应用主体信念-目标-意图(belief-desire-intention,BDI)的Petri网建模方法建立了描述敏捷后勤系统智能和分布特性的Petri网模型。在此基础上,提出了基于高层体系结构(high level architecture,HLA)的敏捷后勤系统分布式仿真体系结构,给出了该类系统的仿真策略。该仿真体系结构将集中式仿真和分布式仿真相结合,较好地反映了敏捷后勤系统的智能性、层次性、分布性、自治性、交互性、动态性等特性。  相似文献   

13.
针对区间判断的权重求解问题,将区间判断矩阵的样本空间映射于n(n-1)/2维向量空间,通过数学推导证明排序权重与向量的各分量之间满足一定条件下的严格单调关系,找出极值存在的可疑点,并证明了权重求解的可疑点定理。给出该定理的简单应用———可疑点组合方法求解的步骤,最后通过算例说明可疑点组合方法的可行性及优越性。  相似文献   

14.
策略重用(policy reuse,PR)作为一种迁移学习(transfer learning,TL)方法,通过利用任务之间的内在联系,将过去学习到的经验、知识用于加速学习当前的目标任务,不仅能够在很大程度上解决传统强化学习(reinforcement learning,RL)收敛速度慢、资源消耗大等问题,而且避免了在...  相似文献   

15.
提出增强学习(RL)解决机器人动态操作任务运动规划的方法。对动态操作任务,分析了如何确定输入输出变量以及强化函数的设计问题;给出用于连续输入输出问题的自适应启发评价(AHC)算法。增强学习解决动态操作任务的运动规划问题,只需要机器人正解进行反复尝试即可学会动作,从而避免了常规运动规划方法中涉及的复杂逆解运算;最后以平面3连杆机器人接取自由飞行的球为例进行仿真研究,结果表明了方法的有效性和可行性。  相似文献   

16.
This paper investigates the guidance method based on reinforcement learning (RL) for the coplanar orbital intercep-tion in a continuous low-thrust scenario. The...  相似文献   

17.
面向区间数形式的多阶段动态不确定综合评价问题,在传统绝对形式排序结论的基础上,进一步从随机模拟的视角讨论该问题的随机聚合求解方法及其他形式的评价结论.首先对体现被评价对象之间两两比较的优胜度概率矩阵进行了介绍,并给出了其模拟求解算法及简化算法;然后基于优胜度概率矩阵,发展出了带有概率特征的可能性排序及用于反映被评价对象不同时期发展状态的动态估值等评价结论.最后,通过武器组装自动化流水线运转情况的动态评价算例对上述多种形式的评价结论进行了求解与分析.多种形式的评价结论,不仅更加吻合动态不确定性评价问题的背景,而且进一步丰富了评价结论的形式,从而可使评价需求方从不同侧面更加全面地了解被评价对象的发展动态.  相似文献   

18.
综合数据包络分析模型及其软件系统设计   总被引:1,自引:0,他引:1  
针对实际问题复杂多样、范围广泛,而数据包络分析(DEA)模型本身又种类较多等特点,首先对多种常用的DEA模型进行了分类研究,指出了每类DEA模型在形式上的具体特点。以此为基础给出了一种能够包含各类模型特征的综合DEA模型和相应的目标规划模型。最后,根据目标规划模型中不同参数与不同模型之间的对应关系设计了能判断多种DEA有效性的综合算法和软件系统。  相似文献   

19.
This paper proposes a liner active disturbance rejection control(LADRC) method based on the Q-Learning algorithm of reinforcement learning(RL) to control the six-degree-of-freedom motion of an autonomous underwater vehicle(AUV).The number of controllers is increased to realize AUV motion decoupling.At the same time, in order to avoid the oversize of the algorithm, combined with the controlled content, a simplified Q-learning algorithm is constructed to realize the parameter adaptation of the LADRC controller.Finally, through the simulation experiment of the controller with fixed parameters and the controller based on the Q-learning algorithm, the rationality of the simplified algorithm, the effectiveness of parameter adaptation, and the unique advantages of the LADRC controller are verified.  相似文献   

20.
采用最大索赔再保费定价原则,结合VaR、CTE、TV三种风险测度方法,通过研究最小化偿付不足风险的概率、期望损失以及均方期望超额损失等再保险问题,得到相应的最优再保险策略,并结合案例对各种最优策略进行静态分析.研究发现,当偿付能力基于VaR或者CTE时,最优的再保险策略是去尾停止损失再保险,这说明原保险公司此时应该更注重对中等巨额损失的保障,而没有动力去保障极值损失;当偿付能力基于TV时,最优策略是带限额的停止损失再保险,此时,保险公司为了保证经营的稳定性,势必会将一部分极值损失分保.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号