共查询到18条相似文献,搜索用时 78 毫秒
1.
伍从斌 《云南大学学报(自然科学版)》1990,12(4):299-306
本文研究具有可数状态空间和任意行动空间的Lippman型无界报酬折扣半马氏决策模型(DSMDM)矩最优策略的结构.证明了:若策略π,σ是(K)矩最优的.则π~nσ及π的任一自组合策略也是(K)矩最优的,且存在与π等价的(K)矩最优策略π~(?),使~nπ~(*hn)为(K)矩最优的;存在(K)矩最优策略的充要条件是(K)矩最优行动集A_K(i)非空;策略π为(K)矩最优当且仅当π_n(A_K(i)|H_n,i)=1,α.e.P_(πn);π为(K)矩最优策略的又一充要条件是它可分解为若干个确定性(K)矩最优策略的一个凸组合.这样,该模型矩最优策略的结构就得到了较完满的解决. 相似文献
2.
张昇 《云南大学学报(自然科学版)》1986,(1)
在Harrison意义下的无界报酬函数折扣模型下,本文讨论了最优策略的几个性质和它的结构。本文证明了:若π~*=(π_1~*,π_2~*,…)是该模型的最优策略,则π_1~(*∞),(π_1~*,…,π_n~*)~∞与(π_1~*,…,π_n~*,π_1~*,π_2~*,…)(n≥1)都是最优策略;给出π_n~*也构成最优随机平稳策略的条件和修改方法;策略π~*=(π_1~*,π_2~*,…)是最优的当且仅当它在任何时刻可达的状态上都必须选取最优决策;最后指出π_0~(*∞)为最优随机平稳策略的充要条件是决策规则π_0~*是若干个最优平稳策略f_n~∞的决策函数f_n的凸组合。从而较完满地解决了Harrison无界报酬意义下折扣模型的最优策略结构问题。 相似文献
3.
讨论了无界报酬非时齐扣马氏决策模型,且哲扣因子βt依赖于前一阶段所处的状态和采取的行动,从而推广了常数折扣因子的马氏决策模型,在一定的假设下,得到了最优方程,证明了存在ε-最优马氏策略。 相似文献
4.
本文主要讨论了无界报酬向量模型的平稳策略问题,给出了改进平稳策略的方法,建立起向量模型的最优方程,获得平稳策略为强最优策略的充要条件.指出最优平稳策略的期望报酬函数必为极大不动点,最后提出一种寻求最优平稳策略的策略迭代算法. 相似文献
5.
6.
7.
张升 《云南大学学报(自然科学版)》1988,(1)
本文讨论在一般状态和行动空间下,Lippman[1]的无界报酬折扣半马氏决策规划的ε(≥0)最优平稳策略的存在性问题,最优策略的性质及这类模型的不变问题,最后给出在有限行动空间下不变问题最优策略的一种算法。 相似文献
8.
本文建立了一类无界向量值报酬折扣马氏决策规划,在一组无关向量生成的凸锥确定的序关系下,讨论了模型最优策略的存在性;给出强最优策略存在的必要充分条件;指出最优策略的自组合、凸组合策咯仍是最优策略;还证明了平稳策略在一般策略类中的优势。 相似文献
9.
张道智 《清华大学学报(自然科学版)》1989,(3)
研究无界报酬折扣半马氏决策规划问题.证明了: 策略π·=(π1·,π2·,…πn·,π·n+1,…)是最优策略,则π1·(∞)及(π1·,π2·,…,πn·)(∞)对同一折扣因子函数也是最优的,对任给的整数n≥1,在一定的条件下,πn·(∞)也是最优的;证明了若最优策略存在,必存在最优平稳策略;证明了ε最优平稳策略的存在性。 相似文献
10.
11.
连续时间折扣模型最优策略的结构 总被引:2,自引:0,他引:2
林元烈 《清华大学学报(自然科学版)》1985,(3)
本文研究了连续时间马氏决策规划折扣模型在(c)上最优策略的若干重要性质和它的结构。由于引进了映像及,使证明大为简化。特别是证明了:一随机平稳策略,它在(c)上是最优的充要条件是它可表为若干个决定性平稳最优策略的凸组合。 相似文献
12.
通过弱收敛定理证明了Neumann边界控制问题在无界区域的解的存在性,此结果为数值计算方法求解这个边界控制问题提供了理论依据。 相似文献
13.
讨论了Banach空间中一类具有无穷时滞泛函积分微分方程解的局部存在性和整体存在性。利用算字半群和无穷时滞理论以及Schauder不动点定理证明了方程解的局部存在性。引入一个适当的不等式条件,并利用解的延拓性质获得了整体存在性。所得结果推广了这类方程解的存在性的已有结论。 相似文献
14.
提出线性需求、每种商品的利润非负,且存在其他约束的条件下多种商品库存和最优价格的非线性规划模型,这个模型符合中国现行的财税体制,有利于商业企业加强营销管理 相似文献
15.
最优组合模型在人口预测中的应用 总被引:6,自引:0,他引:6
迟灵芝 《甘肃联合大学学报(自然科学版)》2005,19(1):13-15
利用文[1]中介绍的方法,结合本溪市1990年—1999年人口总数的统计资料建立了本溪市人口总数预测的最优组合模型,并利用此模型给出了未来几年内本溪市人口总数的预测值。 相似文献
16.
颜未霖 《山西大同大学学报(自然科学版)》2013,(5):10-12
对一类具有阶段结构的两种群竞争模型进行了分析,讨论了该系统正平衡点的局部稳定性,得到了该系统唯一正平衡点全局渐进稳定的条件,由最优控制理论获得了最优捕获策略。 相似文献
17.
杨海霞 《甘肃联合大学学报(自然科学版)》2011,25(1):8-13,19
讨论了两鱼群的竞争系统,每个鱼群都遵守logistic增长规律且向对方释放一种毒素物质.分析了系统的动力性态,研究了毒物对模型稳定性的影响.最后,利用Pantryagin最大值原理讨论了最优收获策略. 相似文献
18.