共查询到17条相似文献,搜索用时 187 毫秒
1.
许青松 《湖南大学学报(自然科学版)》1995,22(5):16-20
本文将策略迭代-逐次逼近法改进以后直接应用到部分可观的马尔可夫决策规划问题中,得到一个新的逐次逼近算法。算法保证能求出一个ε-最优的平稳策略。 相似文献
2.
3.
本文建立了一类无界向量值报酬折扣马氏决策规划,在一组无关向量生成的凸锥确定的序关系下,讨论了模型最优策略的存在性;给出强最优策略存在的必要充分条件;指出最优策略的自组合、凸组合策咯仍是最优策略;还证明了平稳策略在一般策略类中的优势。 相似文献
4.
本文讨论一类非时齐折扣马氏决策规划的总折扣报酬的k(≥1)矩和矩最优问题,得到k矩和矩最优策略存在的一个充要条件;并将k矩最优问题化为同类型的一个马氏决策规划的一阶矩最优问题,从而也解决了这类模型的k矩最优策略的结构问题. 相似文献
5.
6.
在分析通信装备备件随机需求的基础上,结合费用因素,运用马氏决策规划方法,建立了备件随机存储管理的优化模型,并通过模型计算,给出了备件随机存储的最优策略。结果显示以此方法来控制备件储备量既能保障通信装备的维修需求,又能使存储费用降到最低水平。 相似文献
7.
该文针对多无人机在复杂环境下执行作战任务易受环境威胁影响的问题,提出一种基于改进马尔可夫决策过程模型的多无人机航路规划算法.利用离散化雷达威胁信息,设计多无人机作战环境与状态空间数目;将目标点方位空间离散化,进而合理分配状态转移概率;将雷达威胁与马尔可夫决策过程模型相结合,在无模型均匀结构的报酬函数基础上引入非均匀结构... 相似文献
8.
9.
本文在状态集可数、行动集任意的条件下,讨沦报酬函数满足一种推广的绝对平均相对有界的非时齐折扣马氏决策规划;建立了模型的最优方程,证明了ε(>0)最优马氏策略的存在性;最后给出最优策略(最优马氏策略)存在的必要充分条件. 相似文献
10.
油田开发优化决策的目标规划模型 总被引:10,自引:0,他引:10
提出了油田开发中的多目标问题,确定了油田开发措施增油中的多目标体系,建立了措施增油的多目标规划模型,研究了油田开发目标权重的计算方法。以油田开发措施增油方案为例,进行了目标规划模型的建立、求解和优化策略分析,为油田开发措施增油提供了定量决策依据。 相似文献
11.
为了保证企业投资决策最优的投资效果,企业应把投资决策过程分为多个阶段.建立了以获得利润最大化,同时把投资总风险控制在可承受范围内为目标的基本动态规划模型.该模型把一个多阶段的投资问题转化为多个单阶段的问题,从而求解整个投资阶段的最优决策问题就转化成求解一系列单个投资阶段中的最优问题. 相似文献
12.
贾让成 《西北师范大学学报(自然科学版)》1994,30(3):16-19
讨论了向量值离散时间平均准则下的有限马氏决策模型;在采取确定性平稳策略时所得马氏决策过程为遍历的假设下,证明了存在一个至多在K-1个状态是随机的平稳最优策略,并给出了其线性规划算法。同时证明了存在强最优策略的充要条件是其存在强确定性平稳最优策略。 相似文献
13.
在有限马尔可夫决策过程的线性规划求解方法以及神经网络算法的基础上提出了运用神经网络求解有限马尔可夫决策问题的方法.并通过算例验证了该方法的有效性. 相似文献
14.
从线性规划模型解的存在性分析,线性规划模型存在“有解”和“无解”两种情况.“有解”指有最优解,即有可能存在唯一最优解也有可能存在无穷多最优解;“无解”即无可行解或存在无界解(无最优解).唯一最优解、无穷多最优解、无可行解和无界解的判定是线性规划模型求解过程的主要组成部分. 相似文献
15.
吴吉山 《华中科技大学学报(自然科学版)》1987,(Z3)
本文在文献[1]~[3]的基础上,建立了一般意义下的预序模型,并研究了该模型最优策略的结构。文中彻底放弃了状态转移是确定性的假设,将策略从确定性策略类Π~d放宽到一般的随机策略类Π上进行讨论,从而大大地推广了文献[4]的结果。 相似文献
16.
连续时间折扣模型最优策略的结构 总被引:2,自引:0,他引:2
林元烈 《清华大学学报(自然科学版)》1985,(3)
本文研究了连续时间马氏决策规划折扣模型在(c)上最优策略的若干重要性质和它的结构。由于引进了映像及,使证明大为简化。特别是证明了:一随机平稳策略,它在(c)上是最优的充要条件是它可表为若干个决定性平稳最优策略的凸组合。 相似文献
17.
张子刚 《华中科技大学学报(自然科学版)》1988,(2)
本文提出了以用户优化为下级决策,以设施选址优化为上级决策的网络选址两级决策模型,给出了树状网络下模型求解的基本定理及相应的算法,并从一个重要的反例出发,讨论了Braess佯谬与模型的联系。 相似文献