首页 | 本学科首页   官方微博 | 高级检索  
     检索      

MDP平均模型的强最优性
引用本文:郭先平.MDP平均模型的强最优性[J].湖南师范大学自然科学学报,1996,19(1):21-24.
作者姓名:郭先平
作者单位:湖南师范大学数学系
摘    要:考虑的是任意状态空间,任意行动空间MDP平均模型的四个平均准则,在O.H.Lerma的遍历性条件下,利用稳定性定理和可测选择理论简明地证明了存在平稳策略关于此模型的四个平均准则同时是最优的,从而扩充并加强了O.H.Lerma(1989)的主要结果。

关 键 词:马氏决策规划  平均目标  强最优  遍历性  平稳策略

Strong Optimality for MDP Average Model
Guo Xianping.Strong Optimality for MDP Average Model[J].Journal of Natural Science of Hunan Normal University,1996,19(1):21-24.
Authors:Guo Xianping
Abstract:In this paper, we consider four average criteria of MDP with arbitrary state space and action space. Using the theory of measurable selection and the stability theorem,we prove that there exists a stationary policy which is optimal for the four average criteria at the same time under Lermas ergodicity conditions
Keywords:markor decision progranming (MDP)  average creterion  strong optimality  ergodicity  stationary policies
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号