首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 464 毫秒
1.
在Harrison意义下的无界报酬函数折扣模型下,本文讨论了最优策略的几个性质和它的结构。本文证明了:若π~*=(π_1~*,π_2~*,…)是该模型的最优策略,则π_1~(*∞),(π_1~*,…,π_n~*)~∞与(π_1~*,…,π_n~*,π_1~*,π_2~*,…)(n≥1)都是最优策略;给出π_n~*也构成最优随机平稳策略的条件和修改方法;策略π~*=(π_1~*,π_2~*,…)是最优的当且仅当它在任何时刻可达的状态上都必须选取最优决策;最后指出π_0~(*∞)为最优随机平稳策略的充要条件是决策规则π_0~*是若干个最优平稳策略f_n~∞的决策函数f_n的凸组合。从而较完满地解决了Harrison无界报酬意义下折扣模型的最优策略结构问题。  相似文献   

2.
本文在矩最优准则下讨论具有可数状态空间和任意行动空间的Lippman型无界报酬折扣半马氏决策模型。对任意ε>0,证明了k阶矩ε-最优平稳策略的存在性,从而一般策略类中的矩最优性等价于平稳策略类中的矩最优性。(k-1)矩最优策略π为(k)矩最优的充要条件是(-1)~(k 1)V_k(π)满足最优方程,这里V_k(π)为使用π时的总折扣报酬的k阶矩。对平稳策略,给出了折扣报酬的各阶矩的递推公式,如果每个状态可用的行动集为有限集,证明了矩最优平稳策略的存在性,并建立了构造所有矩最优平稳策略的迭代算法。  相似文献   

3.
本文研究了有界报酬折扣模型的ε最优策略性质和结构,讨论了平稳最优策略的凸组合和最优随机平稳策略分解为平稳策略的问题,并证明了若随机平稳策略π_0~∞为ε最优的,则对任给的ε_1>0,都存在一个与π_0~∞有关的f,使f~∞为[(1-β)~(-1)ε_1+ε]最优的。  相似文献   

4.
连续时间折扣模型最优策略的结构   总被引:2,自引:0,他引:2  
本文研究了连续时间马氏决策规划折扣模型在(c)上最优策略的若干重要性质和它的结构。由于引进了映像及,使证明大为简化。特别是证明了:一随机平稳策略,它在(c)上是最优的充要条件是它可表为若干个决定性平稳最优策略的凸组合。  相似文献   

5.
本文研究具有可数状态空间和任意行动空间的Lippman型无界报酬折扣半马氏决策模型(DSMDM)矩最优策略的结构.证明了:若策略π,σ是(K)矩最优的.则π~nσ及π的任一自组合策略也是(K)矩最优的,且存在与π等价的(K)矩最优策略π~(?),使~nπ~(*hn)为(K)矩最优的;存在(K)矩最优策略的充要条件是(K)矩最优行动集A_K(i)非空;策略π为(K)矩最优当且仅当π_n(A_K(i)|H_n,i)=1,α.e.P_(πn);π为(K)矩最优策略的又一充要条件是它可分解为若干个确定性(K)矩最优策略的一个凸组合.这样,该模型矩最优策略的结构就得到了较完满的解决.  相似文献   

6.
设(En,dn)是距离空间(n=1,2,…),定义其乘积空间为(Π∞n=1En,d),d({xn},{yn})=∑∞n=112ndn(xn,yn)1+dn(xn,yn).本文证明了(Π∞n=1En,d)是完备距离空间当且仅当每个因子空间(En,dn)完备,子集AΠ∞n=1En列紧当且仅当A在每个因子空间En中的投影πn(A)列紧.作为应用还给出了:可数紧的距离空间X(即存在紧子集DnX,使X=∪∞n=1Dn且≠DnD0n+1,n=1,2,…)上的连续函数空间C(X),局部p次可积函数空间Lploc(R)以及序列空间S的完备性及其中子集列紧性的刻画  相似文献   

7.
该文推广了Gale-Shapley匹配的男孩-最优算法。证明了当男孩挑选时,允许某些男孩可以不挑选,则G-S匹配的最大步数为n^2-n+1。给出了一般情形下的Gale-Shapley匹配,即有m个男孩,n个女孩时,男孩-最优算法的最大步数是m(m-1)+1,或n(m-1)+1;女孩-最估算法的最大步数是n(n-1)+1,或m(n-1)+1。  相似文献   

8.
本文结合导数、亏量对仪洪勋发表于中国科学(A辑,1994.5,P.457-466)的一个结果进行研究,得到了定理:“设S1={1,ω,…,ω^TR-},S2={∞},其中ω=cxp(2π/m,f和g是非常数亚纯函数。如果m≥4且δ(0,f)+δ(∞,f)〉2,Ef(π)(Si)=Eg(π)(Si)(i=1,2),其中n是非负整数,那么f^n≡g^n或[f^(n)g^(n)^1R]≡1。”例子表明此  相似文献   

9.
研究了半马氏MDP平均模型,提出了新的较弱的假设条件,证明了半马氏MDP平均模型最优方程解的存在性,然后从最优方程出发,证明了存在ε(≥0)-最优平稳策略。  相似文献   

10.
通过对广义二重积分F(α,β)=∫+∞-∞∫+∞-∞(αx+βy)λe-(x2+y2)dxdy作正交变换,得到它满足的函数方程,并求得该函数方程的一般解,进而导出对任意参数λ计算上述广义二重积分的基本定理。并将基本定理推广导出计算广义n重积分F(α1,α2,…,αn)=∫+∞-∞∫+∞-∞…∫+∞-∞(α1x1+α2x2+…+αnxn)λe-(x21+x22+…+x2n)dx1dx2…dxn的公式。  相似文献   

11.
研究了多维扩散模型的最优投资问题.通过对数变换将最优问题的HJB方程转化为半线性偏微分方程,证明了最优投资组合解的存在性,给出了价值函数和最优投资策略.  相似文献   

12.
本文对列车控制问题作出述评,特别对列车优化运行方案加以述评  相似文献   

13.
火车沿水平轨道从一站运行到下一站,要求在给定的时间内完成该行程并使能耗最小。在给定火车操纵杆序时可证明:仅当火车运行速达到转换速度时调整操纵杆,其运行方案才使能耗极小,相应的运行方案称为优化型运行方案。数值计算例子证明了该方案是可行的。  相似文献   

14.
分析了列车能量流程 ,描述了列车节能控制目标 ,并以站间运行时间和运行距离为约束条件 ,以列车运行能耗作为目标函数 ,给出了机械能模型以及具有有限手柄级位的列车离散型控制模型和无级控制连续型模型 .针对无级控制连续型模型 ,建立了哈密顿函数 ,并应用 Pontryagin算法得到了优化操纵策略和模型解  相似文献   

15.
研究了一类具有Lévy噪音随机竞争系统的最优收获问题.通过随机分析方法证明了相应解的随机一致有界性,进而针对给定的优化目标泛函,利用变分方法和对偶原理得到了收获策略的一个必要条件.  相似文献   

16.
假定风险资产价格服从均值回复的指数OU过程(Schwartz模型),而索赔服从带漂移的随机布朗运动,利用随机控制原理分别探讨了幂效用和指数效用保险人的最优再保险与投资策略,并运用数值算例模拟了设定条件下均值回复速率与最优投资策略的关系.结果表明,在含有均值回复特性的市场环境中,最优策略不仅依赖于时间和财富的瞬时绝对量,还依赖于风险资产的现货价格对均值的偏离水平.资产价格的可预测性要求决策者要判断市场发展的不同阶段,针对市场趋势制定不同的投资策略.  相似文献   

17.
交际的成功依赖于话语双方正确领会对方的交际意图,并据此作出积极反应。通过探讨关联理论中的最佳关联对非公开性请求言语行为策略的解释力,分析听话人要正确理解说话人的交际意图必须经过的认知推理以寻求最佳关联的过程。  相似文献   

18.
随着商业贸易和经济全球化的高速发展。广告翻译在国际交流中的重要作用日益凸显。广告无论从形式还是功能上都与众不同的,传统的翻译理论已经无法适应广告翻译的客观要求。本文旨在关联理论及其最佳关联原则的指导下,通过广告实例分析广告翻译策略,证明关联理论对广告翻译所起的指导作用。  相似文献   

19.
某框—剪结构的分部优化设计   总被引:2,自引:0,他引:2  
郭义海  白俊宇  苟雷 《河南科学》2003,21(4):471-474
从结构优化设计理论和结构控制理论的观点出发,针对某办公楼建筑结构的特点及抗震设计的要求,提出了高层框架—剪力墙抗震设计的优化和控制策略,使结构受力合理,降低了材料消耗。结果表明,综合应用优化设计和结构控制理论是降低高层抗震设计经济指标的可行途径。  相似文献   

20.
针对金融工程的最优投资问题,就一维和多维的经典Merton模型,在姿态变量取一个的情形之下,求得相应的非线性二阶Hamilton-Jacobi-Bellman偏微方程,应用Legendre变换将其转化为线性偏微方程,建立对偶问题。继而取定幂效用函数υγ/γ和对数效用函数lnx,分别研究对偶问题,从而求得原问题的精确解析解,确定了风险资产和无风险资产的投资策略,最终实现资产管理的最优配置。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号