首页 | 本学科首页   官方微博 | 高级检索  
     检索      

非平稳MDP平均模型ε_n-最优策略的结构
引用本文:郭先平,刘武旺.非平稳MDP平均模型ε_n-最优策略的结构[J].湖南师范大学自然科学学报,1994(3).
作者姓名:郭先平  刘武旺
作者单位:湖南师范大学数学系,长沙铁道学院
摘    要:本文考虑的是状态空间和行动空间均为一般集的非平稳MDP平均模型εn-最优策略的结构和性质,通过相应的一般决策模型的建立及εn-最优行动集Aεn的引入,讨论了εn-最优策略的凸组合,凸分解等若干性质。

关 键 词:马尔柯夫决策规划(MDP)  非平稳  平均目标  结构  性质
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号