首页 | 本学科首页   官方微博 | 高级检索  
     检索      

依赖于历史的折扣半马氏决策规划
引用本文:张道智.依赖于历史的折扣半马氏决策规划[J].清华大学学报(自然科学版),1989(3).
作者姓名:张道智
作者单位:应用数学系
摘    要:研究无界报酬折扣半马氏决策规划问题.证明了: 策略π·=(π1·,π2·,…πn·,π·n+1,…)是最优策略,则π1·(∞)及(π1·,π2·,…,πn·)(∞)对同一折扣因子函数也是最优的,对任给的整数n≥1,在一定的条件下,πn·(∞)也是最优的;证明了若最优策略存在,必存在最优平稳策略;证明了ε最优平稳策略的存在性。

关 键 词:折扣因子函数  最优策略  最优平稳策略

Semi-Markov Decision Process with Discount Factors Depend on History
Zhang Daozhi.Semi-Markov Decision Process with Discount Factors Depend on History[J].Journal of Tsinghua University(Science and Technology),1989(3).
Authors:Zhang Daozhi
Institution:Department of Applied Mathematics
Abstract:
Keywords:discount factors  optimal strategies  optimal stationary strategies
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号