观察过程状态数为可数的POMDP的算法 Algorithm of Discounted Model of POMDP with Denumerable States in Observation Process期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

观察过程状态数为可数的POMDP的算法

引用本文：	许青松. 观察过程状态数为可数的POMDP的算法[J]. 湖南大学学报(自然科学版), 1996, 23(1): 25-32

作者姓名：	许青松

作者单位：	湖南大学应用数学系

摘要：	给出了观察过程状态数为可数时，部分可观的马尔可夫决策规划（ＰＯＭＤＰ）折扣模型的逼近法和算法，算法保证了能求到ε－最优的平稳策略和ε－最优的期望费用函数。
关键词：	ε－最优策略马氏决策规划折扣模型算法
Algorithm of Discounted Model of POMDP with Denumerable States in Observation Process

Xu Qingsong. Algorithm of Discounted Model of POMDP with Denumerable States in Observation Process[J]. Journal of Hunan University(Naturnal Science), 1996, 23(1): 25-32

Authors:	Xu Qingsong

Abstract:

Keywords:
本文献已被 CNKI 维普等数据库收录！
	点击此处可从《湖南大学学报(自然科学版)》浏览原始摘要信息
	点击此处可从《湖南大学学报(自然科学版)》下载全文