排序方式: 共有2条查询结果,搜索用时 15 毫秒
1
1.
连续时间总报酬马氏决策规划 总被引:2,自引:0,他引:2
以期望总报酬为准则的连续时间马氏决策规划,自R.A.Bellman(1957),特别是Miller研究以来,已有一些文献报道。这些文献,就我们所知,都是从微分方程型的最优方程出发,给出一个策略是最优的充要条件。这种条件是不便于验证的。本文对更广的模型,给出了一个策略是最优的新的充要条件(定理4和5),该条件颇为直观;并进一步探讨了最优 相似文献
2.
本文考虑可数状态可数行为有界报酬的连续时间马氏决策规划,放弃了以往关于其中的转移速率阵族一致有界的假设,而是在一个弱得多的新假设下进行问题的讨论,即 相似文献
1