平均模型的Bellman最优原理 |
| |
引用本文: | 刘建庸.平均模型的Bellman最优原理[J].科学通报,1989,34(15):1193-1193. |
| |
作者姓名: | 刘建庸 |
| |
作者单位: | 中国科学院应用数学研究所 北京
(刘建庸),中国科学院应用数学研究所 北京(刘克) |
| |
摘 要: | 本文讨论的平均模型为{S,(A(i),i∈S),q,r,(?)/(?)},其中状态空间S与每个行动集A(i)均为非空可数集;q为平稳的状态一步转移概率簇;r为报酬函数,一致有界。设Π、Π_s~d分别表示一般策略类和平稳策略类。
|
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《科学通报》浏览原始摘要信息 |
| 点击此处可从《科学通报》下载免费的PDF全文 |
|