首页 | 本学科首页   官方微博 | 高级检索  
     检索      

部分可观测马尔可夫决策过程算法综述
引用本文:桂林,武小悦.部分可观测马尔可夫决策过程算法综述[J].系统工程与电子技术,2008,30(6).
作者姓名:桂林  武小悦
作者单位:国防科技大学信息系统与管理学院,湖南,长沙,410073
摘    要:部分可观测马尔可夫决策过程(POMDP)是马尔可夫决策过程(MDP)的扩展,它允许系统的状态信息部分可知。但POMDP的可能应用大部分没有实现,这主要是因为缺乏有效的算法。POMDP的算法分为近似算法和精确算法,精确算法是构造近似算法的基础。介绍了POMDP模型后,对离散时间、有限状态集的POMDP精确算法和近似算法进行了综述,分析了造成POMDP难以求解的主要原因,提出了进一步的研究方向。

关 键 词:部分可观测马尔可夫决策过程  算法  综述

Survey of algorithms for partially observable Markov decision processes
GUI Lin,WU Xiao-yue.Survey of algorithms for partially observable Markov decision processes[J].System Engineering and Electronics,2008,30(6).
Authors:GUI Lin  WU Xiao-yue
Abstract:A partially observable Markov decision process(POMDP) is an extension of a Markov decision process(MDP),which can partially keep the state of the system under observation.The applied potential for POMDP remains largely unrealized due to lack of tractable solution methodologies.The POMDP algorithms can divide into the approximate algorithms and the exact algorithms,and the exact algorithms are the base of the approximate algorithms.The exact and approximate algorithms for solving discrete-time,finite POMDP over finite horizon are summarized.In the end the reasons why POMDP problems are intractable and the future research directions are proposed.
Keywords:partially observable Markov decision process  algorithm  survey
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号