首页 | 本学科首页   官方微博 | 高级检索  
     检索      

非平稳MDP平均模型的ε(≥O)-最优策略存在的充分条件
引用本文:郭先平.非平稳MDP平均模型的ε(≥O)-最优策略存在的充分条件[J].湖南师范大学自然科学学报,1992(4).
作者姓名:郭先平
作者单位:湖南师范大学数学系
摘    要:本文考虑的是状态和行动空间均为一般集的非平稳MDP平均模型.本文采用扩大状态空间的方法,给出了非平稳MDP平均模型的最优方程有解及其ε(≥0)-最优策略存在的几组充分条件,推广了有关平稳MDP平均模型的结果,尤其是Hernandez—Lerma(1989)等的结果.

关 键 词:马尔柯夫决策规划(MDP)  非平稳  平均目标
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号