首页 | 本学科首页   官方微博 | 高级检索  
     检索      

折扣马尔可夫决策规划的初等方法
引用本文:董泽清,甘应爱.折扣马尔可夫决策规划的初等方法[J].华中科技大学学报(自然科学版),1987(4).
作者姓名:董泽清  甘应爱
作者单位:中国科学院应用数学所 (董泽清),华中工学院数学系(甘应爱)
摘    要:对于状态空间为可列集、行为空间为任意非空集、报酬函数为有界的折扣模型,本文用初等方法反而比用传统方法更快地获得了标准的结果:存在一个平稳策略是ε最优的;最优值函数是最优方程的唯一有界解。这表明用初等方法来研究该模型ε(≥0)最优策略的性质和结构是完全可行的。

关 键 词:马尔可夫决策  状态空间  行为空间  报酬函数  最优策略  ε最优

Elementary Method for Discounted Markovian Decision Programming
Dong Zeqing Gan Yingai.Elementary Method for Discounted Markovian Decision Programming[J].JOURNAL OF HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY.NATURE SCIENCE,1987(4).
Authors:Dong Zeqing Gan Yingai
Institution:Dong Zeqing Gan Yingai
Abstract:
Keywords:
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号