非平稳MDP平均模型ε_n-最优策略的结构 |
| |
引用本文: | 郭先平,刘武旺.非平稳MDP平均模型ε_n-最优策略的结构[J].湖南师范大学自然科学学报,1994(3). |
| |
作者姓名: | 郭先平 刘武旺 |
| |
作者单位: | 湖南师范大学数学系,长沙铁道学院 |
| |
摘 要: | 本文考虑的是状态空间和行动空间均为一般集的非平稳MDP平均模型εn-最优策略的结构和性质,通过相应的一般决策模型的建立及εn-最优行动集Aεn的引入,讨论了εn-最优策略的凸组合,凸分解等若干性质。
|
关 键 词: | 马尔柯夫决策规划(MDP) 非平稳 平均目标 结构 性质 |
本文献已被 CNKI 等数据库收录! |
|