Q（f）—过程非唯一时连续时间折扣目标MDP 期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

Q（f）—过程非唯一时连续时间折扣目标MDP

作者姓名：	郭先平

摘要：	考虑的是可数状态空间连续时间ＭＤＰ的折扣模型，与以往不同的是，我们放弃了由策略ｆ所确定的Ｑ（ｆ）－过程唯一的传统假设。而首次考虑Ｑ（ｆ）－过程非唯一的情形，借助于Ｑ－过程的构造理论，用拓扑分析的方法，证明了最优策略的存在性。
关键词：	连续时间折扣目标 Q过程马氏决策规划
本文献已被维普等数据库收录！