期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	2篇
免费	0篇

专业分类

教育与普及

2篇

出版年

1987年	1篇
1985年	1篇

排序方式： 共有2条查询结果，搜索用时 15 毫秒

连续时间总报酬马氏决策规划 总被引：2，自引：0，他引：2

宋京生《科学通报》1987,32(16):1201-1201

以期望总报酬为准则的连续时间马氏决策规划,自R.A.Bellman(1957),特别是Miller研究以来,已有一些文献报道。这些文献,就我们所知,都是从微分方程型的最优方程出发,给出一个策略是最优的充要条件。这种条件是不便于验证的。本文对更广的模型,给出了一个策略是最优的新的充要条件(定理4和5),该条件颇为直观;并进一步探讨了最优相似文献

转移速率矩阵族非一致有界的连续时间马尔可夫决策规划

宋京生《科学通报》1985,30(9):716-716

本文考虑可数状态可数行为有界报酬的连续时间马氏决策规划,放弃了以往关于其中的转移速率阵族一致有界的假设,而是在一个弱得多的新假设下进行问题的讨论,即相似文献