期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	3篇
免费	0篇

专业分类

教育与普及

3篇

出版年

1995年	1篇
1989年	1篇
1988年	1篇

排序方式： 共有3条查询结果，搜索用时 78 毫秒

具有多个向量约束的折扣马氏决策规划

刘建庸《科学通报》1995,40(16):1448-1448

文献[1]讨论了具有一个向量约束的折扣马氏决策规划,该文将约束最优问题化为一个Lagrange规划问题.但该文没有解决约束最优策略的存在性问题,也没有给出有效的算法.胡光华文中讨论了具有一个实数值约束的折扣半马氏决策规划.在适当的条件下,该文证明了存在混合平稳策略是约束最优策略,并给出了算法.文献[2]给出了在马氏策略类及平稳策略类中求约束最优策略的算法. 相似文献

具有递归报酬函数的马氏决策规划

刘建庸《科学通报》1988,33(8):637-637

本文所研究的马氏决策规划:{S,A,q_n,g},其中状态空间S、行动集A均为可列集,转移律q_n是非时齐的。报酬函数为相似文献

平均模型的Bellman最优原理

刘建庸《科学通报》1989,34(15):1193-1193

本文讨论的平均模型为{S,(A(i),i∈S),q,r,(?)/(?)},其中状态空间S与每个行动集A(i)均为非空可数集;q为平稳的状态一步转移概率簇;r为报酬函数,一致有界。设Π、Π_s~d分别表示一般策略类和平稳策略类。相似文献