期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	15篇
免费	0篇

专业分类

丛书文集	10篇
综合类	5篇

出版年

排序方式： 共有15条查询结果，搜索用时 109 毫秒

1 [2] 下一页 » 末页»

相似文献

相似文献

相似文献

考虑的是任意状态空间，任意行动空间ＭＤＰ平均模型的四个平均准则，在Ｏ．Ｈ．Ｌｅｒｍａ的遍历性条件下，利用稳定性定理和可测选择理论简明地证明了存在平稳策略关于此模型的四个平均准则同时是最优的，从而扩充并加强了Ｏ．Ｈ．Ｌｅｒｍａ（１９８９）的主要结果。相似文献

本文给出常微分方程Ｌξｆ＝０解的特性和常微分方程Ｌξｆξ＝０解的渐近行为。相似文献

考虑的是可数状态空间连续时间ＭＤＰ的折扣模型，与以往不同的是，我们放弃了由策略ｆ所确定的Ｑ（ｆ）－过程唯一的传统假设．而首次考虑Ｑ（ｆ）－过程非唯一的情形，借助于Ｑ－过程的构造理论，用拓扑分析的方法，证明了最优策略的存在性．相似文献

相似文献

讨论了赔付函数可能既无上界又无下界的离散时间可数状态非零和随机对策的折扣模型。在零和随机对策中常用的“漂移”和“连续-紧”性条件下, 用Fan's不动点定理证明了Nash平衡点的存在性。相似文献

本文考虑的是状态空间和行动空间均为一般集的非平稳ＭＤＰ平均模型εｎ－最优策略的结构和性质，通过相应的一般决策模型的建立及εｎ－最优行动集Ａεｎ的引入，讨论了εｎ－最优策略的凸组合，凸分解等若干性质。相似文献

10.

考虑的是可数状态空间连续时间ＭＤＰ的折扣模型，与以往不同的是，我们放弃了由策略ｆ所确定的Ｑ（ｆ）－过程唯一的传统假设。而首次考虑Ｑ（ｆ）－过程非唯一的情形，借助于Ｑ－过程的构造理论，用拓扑分析的方法，证明了最优策略的存在性。相似文献

1 [2] 下一页 » 末页»