共查询到20条相似文献,搜索用时 234 毫秒
1.
伍从斌 《云南大学学报(自然科学版)》1991,13(3):199-206
本文在矩最优准则下讨论具有可数状态空间和任意行动空间的Lippman型无界报酬折扣半马氏决策模型。对任意ε>0,证明了k阶矩ε-最优平稳策略的存在性,从而一般策略类中的矩最优性等价于平稳策略类中的矩最优性。(k-1)矩最优策略π为(k)矩最优的充要条件是(-1)~(k 1)V_k(π)满足最优方程,这里V_k(π)为使用π时的总折扣报酬的k阶矩。对平稳策略,给出了折扣报酬的各阶矩的递推公式,如果每个状态可用的行动集为有限集,证明了矩最优平稳策略的存在性,并建立了构造所有矩最优平稳策略的迭代算法。 相似文献
2.
为了求解多阶段群体决策问题,作者建立了多阶段群体决策模型,定义了Pareto最优策略及绝对最优策略等概念,提出了求解Pareto最优策略的群体动态规划算法.该算法可以求得各个阶段各个状态下的所有Pareto最优策略.最后,作者用一个计算实例说明了算法的求解过程. 相似文献
3.
动态规划的理论和方法在求解多阶段决策问题中是卓有成效的 ,逆序递推法又是动态规划中基本方法的核心 .本文给出了动态规划中最优性原理的证明 ,还通过实例介绍了逆序递推方法的具体应用 . 相似文献
4.
在 2× 2矩阵对策的基础上 ,讨论了 3× 3矩阵对策Γ ={SⅠ ,S∏ ;A}的代数法求解 .给出了矩阵对策A有非零混合最优策略的条件 ,最优策略的求解公式及 3× 3矩阵对策的一般求解步骤 .对 3×m矩阵对策的代数法求解过程进行了进一步的讨论 . 相似文献
5.
6.
7.
为实现航班运行控制的全局规划和控制策略定量评价,打破传统多集中于规章手册的定性分析的运行控制技术方法,建立航班运行控制最短路径最小代价的策略构架图,提出三级控制策略的最优性动态规划运行控制模型;设计改进的动态规划递推方程,通过数值计算算法,得到表格形式的最优控制与最优代价函数,解决了航班运行控制决策这一类非线性离散复合型规划问题无法得到最优控制解析表达式的困难。最后,引入航班运行实例测试模型和算法的适应性和优越性,实验结果表明,动态全局规划不同于传统的每个航班独自分阶段的“点式思维模式”,实现了整个公司所有航班、所有航站和所有机队的全局运行控制优化。 相似文献
8.
基于摹加代数,将一类装配线平衡问题转化为TSP问题.在摹加运算的基础上,将装配线平衡问题的优先关系图转化为混合图中的TSP问题,通过案例演示,以改进的遗传算法为求解混合图中的TSP算法,以路径最短为目标函数.利用随机变异跳出局部最优,最终结果收敛于全局最优或近似全局最优. 相似文献
9.
10.
两阶段随机二阶锥规划模型在工程和生产等许多实际问题中有广泛的应用,该模型的有效求解方法备受关注.最优性条件在算法设计中扮演着重要的角色.基于Lagrange对偶理论,主要探讨具有离散分布的两阶段随机二阶锥规划问题的最优性条件.在Slater条件下,建立了第二阶段问题的对偶问题并分析了最优值函数的次微分性质;当随机数据服从离散分布时,证明了两阶段随机二阶锥规划问题的最优性条件. 相似文献
11.
考虑一类随机中立型时滞微分方程最优性的Bellm an原则问题.推广了随机微分方程和随机时滞微分方程的相应结论. 相似文献
12.
多变量系统最小能量终端控制 总被引:1,自引:0,他引:1
刘轩黄 《华中师范大学学报(自然科学版)》2002,36(1):11-16
以广义逆矩阵的理论和Bellman最优性原理为基础,给出了MIMO系统的状态反馈型的闭型解,对最优终端控制问题作了进一步的详细研究,且通过具有零初始状态的线性定常系统的研究,导出了终端控制误差和控制能量与控制时间的关系。 相似文献
13.
刘轩黄 《苏州科技学院学报(自然科学版)》2005,22(1):1-9
以广义逆矩阵的理论和Bellman动态规划方法为基础,给出了离散线性时变系统最优和最小能量最优跟踪问题的两种形式的解,对每一种情形,还给出了最小跟踪误差和最小控制能量的简洁表达式. 相似文献
14.
文章讨论了半线性椭圆最优控制问题的二阶最优性条件.假设约束集满足一些特殊性质,得到了半线性椭圆最优控制问题的二次增长条件、二阶充分最优性条件和二阶必要的最优性条件.最后证明了这三个条件是等价的. 相似文献
15.
张明泉 《西南石油大学学报(自然科学版)》1988,10(3):45-55
假设给定区间上的单峰函数的峰位点服从一给定的概率分布,对于任一给定的试脸策略,本文定义了相应的多阶段决策过程‘时任a给定的精度标准。和两试验点间最小允许距离do(do相似文献
16.
研究了一类半Markov控制过程(SMCP)在紧致行动集上关于无限水平平均代价准则的性能优化算法.利用等价Markov过程的方法,导出了SMCP的性能势公式和平均代价最优性方程,给出了求解最优或次最优平稳策略的策略迭代算法和数值迭代算法,并证明了算法的收敛性.最后给出了一个数值例子来说明算法的应用. 相似文献
17.
本文主要讨论了无界报酬向量模型的平稳策略问题,给出了改进平稳策略的方法,建立起向量模型的最优方程,获得平稳策略为强最优策略的充要条件.指出最优平稳策略的期望报酬函数必为极大不动点,最后提出一种寻求最优平稳策略的策略迭代算法. 相似文献
18.
周秀君 《青海师范大学学报(自然科学版)》2011,27(1):9-12
提出了—种求解线性二层规划的神经网络方法.采用以下层问题的对偶间隙为罚项,构造线性二层规划罚问题的思想,将线性二层规划转化成相应的单层规划问题,然后设计求解单层规划问题的神经网络模型,从而得到线性二层规划的最优解.该网络是Lyapunov稳定的,且在适当的条件下收敛于线性二层规划的最优解,仿真结果表明该神经网络可以有效地得到线性二层规划的最优解. 相似文献
19.
用线性规划对偶理论讨论了线性双层规划的最优性条件,利用下层问题的对偶间隙,将线性双层规划转化为目标函数带惩罚项的单层问题,通过对转化后的单层问题进行求解,给出了一个求解线性双层规划局部最优解的方法,然后引进一种割平面约束来修正当前局部最优解,直到求得线性双层规划的全局最优解。提出的算法具有全局收敛性,并通过一个算例说明了算法的求解过程。 相似文献
20.
给出了常系数线性系统李雅普诺夫函数最优性的一种定义,针对特征根本为实单根以及特征根具有共轭复根等情况,分别给出用二次型写出的最优李雅普诺夫函数公式。算例表明,用最优李雅普诺夫函数获得的吸引区域,较其它李雅普诺夫函数获得的吸引区域,更接近系统的真实的吸引区域。 相似文献