首页 | 本学科首页   官方微博 | 高级检索  
     

连续时间MDP及其与离散时间MDP的关系
作者姓名:胡奇英
作者单位:西安电子科技大学
摘    要:本文讨论的连续时间MDP(Continuous Time MDP,简记为CTMDP)折扣模型为{S,(A(i),(i),i∈S),q,r,a},其中状态集S可列;行动集A(i)为任意非空集,(i)为其上的σ-代数,它包含A(i)的所有单点集;转移速率族q(j|i,a)满足:i∈S,a∈A(i)均有—∞
关 键 词:连续时间MDP 离散时间MDP 最优方程
本文献已被 CNKI 维普 等数据库收录!
点击此处可从《科学通报》浏览原始摘要信息
点击此处可从《科学通报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号