排序方式: 共有1条查询结果,搜索用时 15 毫秒
1
1.
本文研究了有界报酬折扣模型的ε最优策略性质和结构,讨论了平稳最优策略的凸组合和最优随机平稳策略分解为平稳策略的问题,并证明了若随机平稳策略π_0~∞为ε最优的,则对任给的ε_1>0,都存在一个与π_0~∞有关的f,使f~∞为[(1-β)~(-1)ε_1+ε]最优的。 相似文献
1