首页 | 本学科首页   官方微博 | 高级检索  
     

观察过程状态数为可数的POMDP的算法
引用本文:许青松. 观察过程状态数为可数的POMDP的算法[J]. 湖南大学学报(自然科学版), 1996, 23(1): 25-32
作者姓名:许青松
作者单位:湖南大学应用数学系
摘    要:给出了观察过程状态数为可数时,部分可观的马尔可夫决策规划(POMDP)折扣模型的逼近法和算法,算法保证了能求到ε-最优的平稳策略和ε-最优的期望费用函数。

关 键 词:ε-最优策略 马氏决策规划 折扣模型 算法

Algorithm of Discounted Model of POMDP with Denumerable States in Observation Process
Xu Qingsong. Algorithm of Discounted Model of POMDP with Denumerable States in Observation Process[J]. Journal of Hunan University(Naturnal Science), 1996, 23(1): 25-32
Authors:Xu Qingsong
Abstract:
Keywords:
本文献已被 CNKI 维普 等数据库收录!
点击此处可从《湖南大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《湖南大学学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号