无界报酬向量值折扣马氏决策规划—最优平稳策略及算法 |
| |
引用本文: | 张升,张继红.无界报酬向量值折扣马氏决策规划—最优平稳策略及算法[J].云南大学学报(自然科学版),1994,16(4):299-305. |
| |
作者姓名: | 张升 张继红 |
| |
作者单位: | 云南大学,昆明工学院 |
| |
摘 要: | 本文主要讨论了无界报酬向量模型的平稳策略问题,给出了改进平稳策略的方法,建立起向量模型的最优方程,获得平稳策略为强最优策略的充要条件.指出最优平稳策略的期望报酬函数必为极大不动点,最后提出一种寻求最优平稳策略的策略迭代算法.
|
关 键 词: | 折扣马氏决策规划,最优平稳策略,无界报酬向量 |
本文献已被 CNKI 维普 等数据库收录! |
|