首页 | 本学科首页   官方微博 | 高级检索  
     检索      

平均模型的Bellman最优原理
引用本文:刘建庸.平均模型的Bellman最优原理[J].科学通报,1989,34(15):1193-1193.
作者姓名:刘建庸
作者单位:中国科学院应用数学研究所 北京 (刘建庸),中国科学院应用数学研究所 北京(刘克)
摘    要:本文讨论的平均模型为{S,(A(i),i∈S),q,r,(?)/(?)},其中状态空间S与每个行动集A(i)均为非空可数集;q为平稳的状态一步转移概率簇;r为报酬函数,一致有界。设Π、Π_s~d分别表示一般策略类和平稳策略类。

本文献已被 CNKI 等数据库收录!
点击此处可从《科学通报》浏览原始摘要信息
点击此处可从《科学通报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号