非平稳MDP平均模型的ε(≥O)-最优策略存在的充分条件 |
| |
引用本文: | 郭先平.非平稳MDP平均模型的ε(≥O)-最优策略存在的充分条件[J].湖南师范大学自然科学学报,1992(4). |
| |
作者姓名: | 郭先平 |
| |
作者单位: | 湖南师范大学数学系 |
| |
摘 要: | 本文考虑的是状态和行动空间均为一般集的非平稳MDP平均模型.本文采用扩大状态空间的方法,给出了非平稳MDP平均模型的最优方程有解及其ε(≥0)-最优策略存在的几组充分条件,推广了有关平稳MDP平均模型的结果,尤其是Hernandez—Lerma(1989)等的结果.
|
关 键 词: | 马尔柯夫决策规划(MDP) 非平稳 平均目标 |
本文献已被 CNKI 等数据库收录! |
|