首页 | 本学科首页   官方微博 | 高级检索  
     

折扣马尔可夫决策规划的初等方法
引用本文:董泽清,甘应爱. 折扣马尔可夫决策规划的初等方法[J]. 华中科技大学学报(自然科学版), 1987, 0(4)
作者姓名:董泽清  甘应爱
作者单位:中国科学院应用数学所(董泽清),华中工学院数学系(甘应爱)
摘    要:对于状态空间为可列集、行为空间为任意非空集、报酬函数为有界的折扣模型,本文用初等方法反而比用传统方法更快地获得了标准的结果:存在一个平稳策略是ε最优的;最优值函数是最优方程的唯一有界解。这表明用初等方法来研究该模型ε(≥0)最优策略的性质和结构是完全可行的。

关 键 词:马尔可夫决策  状态空间  行为空间  报酬函数  最优策略  ε最优

Elementary Method for Discounted Markovian Decision Programming
Dong Zeqing Gan Yingai. Elementary Method for Discounted Markovian Decision Programming[J]. JOURNAL OF HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY.NATURE SCIENCE, 1987, 0(4)
Authors:Dong Zeqing Gan Yingai
Affiliation:Dong Zeqing Gan Yingai
Abstract:
Keywords:
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号