首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 3 毫秒
1.
本文研究具有可数状态空间和任意行动空间的Lippman型无界报酬折扣半马氏决策模型(DSMDM)矩最优策略的结构.证明了:若策略π,σ是(K)矩最优的.则π~nσ及π的任一自组合策略也是(K)矩最优的,且存在与π等价的(K)矩最优策略π~(?),使~nπ~(*hn)为(K)矩最优的;存在(K)矩最优策略的充要条件是(K)矩最优行动集A_K(i)非空;策略π为(K)矩最优当且仅当π_n(A_K(i)|H_n,i)=1,α.e.P_(πn);π为(K)矩最优策略的又一充要条件是它可分解为若干个确定性(K)矩最优策略的一个凸组合.这样,该模型矩最优策略的结构就得到了较完满的解决.  相似文献   

2.
本文在矩最优准则下讨论具有可数状态空间和任意行动空间的Lippman型无界报酬折扣半马氏决策模型。对任意ε>0,证明了k阶矩ε-最优平稳策略的存在性,从而一般策略类中的矩最优性等价于平稳策略类中的矩最优性。(k-1)矩最优策略π为(k)矩最优的充要条件是(-1)~(k 1)V_k(π)满足最优方程,这里V_k(π)为使用π时的总折扣报酬的k阶矩。对平稳策略,给出了折扣报酬的各阶矩的递推公式,如果每个状态可用的行动集为有限集,证明了矩最优平稳策略的存在性,并建立了构造所有矩最优平稳策略的迭代算法。  相似文献   

3.
4.
5.
本文研究了有界报酬折扣模型的ε最优策略性质和结构,讨论了平稳最优策略的凸组合和最优随机平稳策略分解为平稳策略的问题,并证明了若随机平稳策略π_0~∞为ε最优的,则对任给的ε_1>0,都存在一个与π_0~∞有关的f,使f~∞为[(1-β)~(-1)ε_1+ε]最优的。  相似文献   

6.
随机变数高阶矩的计算一般来说是困难的,因此估值显得很重要。本文对于二点分布K阶绝对矩证明了如下两个定理: 定理1.如果独立随机变数§_1,§_2,…,§n都有二点分布则对于实数集{a_1,a_2,…,a_n}有其中 定理2.如果独立随机变数§_1,§_2,…,§n都有二点分布则对于实数集{a_1,a_2,…,a_n}有 其中  相似文献   

7.
本文讨论一类非时齐折扣马氏决策规划的总折扣报酬的k(≥1)矩和矩最优问题,得到k矩和矩最优策略存在的一个充要条件;并将k矩最优问题化为同类型的一个马氏决策规划的一阶矩最优问题,从而也解决了这类模型的k矩最优策略的结构问题.  相似文献   

8.
连续时间折扣模型最优策略的结构   总被引:2,自引:0,他引:2  
本文研究了连续时间马氏决策规划折扣模型在(c)上最优策略的若干重要性质和它的结构。由于引进了映像及,使证明大为简化。特别是证明了:一随机平稳策略,它在(c)上是最优的充要条件是它可表为若干个决定性平稳最优策略的凸组合。  相似文献   

9.
在Harrison意义下的无界报酬函数折扣模型下,本文讨论了最优策略的几个性质和它的结构。本文证明了:若π~*=(π_1~*,π_2~*,…)是该模型的最优策略,则π_1~(*∞),(π_1~*,…,π_n~*)~∞与(π_1~*,…,π_n~*,π_1~*,π_2~*,…)(n≥1)都是最优策略;给出π_n~*也构成最优随机平稳策略的条件和修改方法;策略π~*=(π_1~*,π_2~*,…)是最优的当且仅当它在任何时刻可达的状态上都必须选取最优决策;最后指出π_0~(*∞)为最优随机平稳策略的充要条件是决策规则π_0~*是若干个最优平稳策略f_n~∞的决策函数f_n的凸组合。从而较完满地解决了Harrison无界报酬意义下折扣模型的最优策略结构问题。  相似文献   

10.
研究无界报酬折扣半马氏决策规划问题.证明了: 策略π·=(π1·,π2·,…πn·,π·n+1,…)是最优策略,则π1·(∞)及(π1·,π2·,…,πn·)(∞)对同一折扣因子函数也是最优的,对任给的整数n≥1,在一定的条件下,πn·(∞)也是最优的;证明了若最优策略存在,必存在最优平稳策略;证明了ε最优平稳策略的存在性。  相似文献   

11.
12.
对离散型随机变量的k阶矩进行了研究,给出了几类离散型随机变量的k阶原点矩的统一递推公式,得到了离散型随机变量的k阶原点矩的形式特征.  相似文献   

13.
本文主要讨论了无界报酬向量模型的平稳策略问题,给出了改进平稳策略的方法,建立起向量模型的最优方程,获得平稳策略为强最优策略的充要条件.指出最优平稳策略的期望报酬函数必为极大不动点,最后提出一种寻求最优平稳策略的策略迭代算法.  相似文献   

14.
本文讨论了π_m~4上有界报酬折扣马氏决策模型的七个等价条件,从而剖析了最优策略的结构。  相似文献   

15.
研究了半马氏MDP平均模型,提出了新的较弱的假设条件,证明了半马氏MDP平均模型最优方程解的存在性,然后从最优方程出发,证明了存在ε(≥0)-最优平稳策略。  相似文献   

16.
本文讨论在一般状态和行动空间下,Lippman[1]的无界报酬折扣半马氏决策规划的ε(≥0)最优平稳策略的存在性问题,最优策略的性质及这类模型的不变问题,最后给出在有限行动空间下不变问题最优策略的一种算法。  相似文献   

17.
本文提出了折扣非时齐半马氏决策模型(N-SMDM)的概念,用比较初等的方法证明了最优方程成立;给出了 Bellman 最优化原理在 N-SMDM 中的形式,并进行了严格的证明.  相似文献   

18.
讨论折扣非时齐半马氏决策模型的正则性条件和两种目标函数的等价性。  相似文献   

19.
对于半参数回归模型 Yni=β·tni+g(xni)+εni,1≤i≤n, 其中{εni,1≤i≤n}为PA相依误差,在适当的条件下, 得到未知回归函数g(x)和未知参数β估计量的r 阶矩相合性。  相似文献   

20.
文章在相关文献的基础上,重新考虑了变质率服从两参数的Weibull分布,分别假设需求受库存和受销售价格影响,建立了以库存系统费用最小为目标的零售商的最优库存模型,并在此基础上得到了最优订货数量和付款时间的判定方法;通过数据研究表明,折扣与延期支付2个要素对变质条件不同的需求函数影响是不同的,并呈现出一定规律。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号