首页 | 本学科首页   官方微博 | 高级检索  
     检索      

观察过程状态数为可数的POMDP的算法
引用本文:许青松.观察过程状态数为可数的POMDP的算法[J].湖南大学学报(自然科学版),1996,23(1):25-32.
作者姓名:许青松
作者单位:湖南大学应用数学系
摘    要:给出了观察过程状态数为可数时,部分可观的马尔可夫决策规划(POMDP)折扣模型的逼近法和算法,算法保证了能求到ε-最优的平稳策略和ε-最优的期望费用函数。

关 键 词:ε-最优策略  马氏决策规划  折扣模型  算法

Algorithm of Discounted Model of POMDP with Denumerable States in Observation Process
Xu Qingsong.Algorithm of Discounted Model of POMDP with Denumerable States in Observation Process[J].Journal of Hunan University(Naturnal Science),1996,23(1):25-32.
Authors:Xu Qingsong
Abstract:
Keywords:
本文献已被 CNKI 维普 等数据库收录!
点击此处可从《湖南大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《湖南大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号