首页 | 本学科首页   官方微博 | 高级检索  
     检索      

部分可观的马尔可夫决策规划折扣模型的解法
引用本文:许青松.部分可观的马尔可夫决策规划折扣模型的解法[J].湖南大学学报(自然科学版),1995,22(5):16-20.
作者姓名:许青松
作者单位:湖南大学应用数学系
摘    要:本文将策略迭代-逐次逼近法改进以后直接应用到部分可观的马尔可夫决策规划问题中,得到一个新的逐次逼近算法。算法保证能求出一个ε-最优的平稳策略。

关 键 词:迭代  收敛  ε-最优策略  马氏决策规划  折扣模型

Algorithm of Discounted Model of Partially Observable Markov Decision Programming
Xu Qingsong.Algorithm of Discounted Model of Partially Observable Markov Decision Programming[J].Journal of Hunan University(Naturnal Science),1995,22(5):16-20.
Authors:Xu Qingsong
Abstract:
Keywords:
本文献已被 CNKI 维普 等数据库收录!
点击此处可从《湖南大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《湖南大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号