首页 | 本学科首页   官方微博 | 高级检索  
     检索      

在概率阈值准则下马尔可夫策略的最优化算法
引用本文:姜峰,郑兆青.在概率阈值准则下马尔可夫策略的最优化算法[J].山东理工大学学报,2004,18(1):62-65.
作者姓名:姜峰  郑兆青
作者单位:[1]菏泽师范专科学校教务科,山东菏泽274015 [2]山东理工大学外事学院,山东淄博255049
摘    要:在一种新的概率阈值准则下讨论马尔可夫决策的最优解的算法问题.采用基于增益的过去累积值的方法,求解马尔可夫最优策略.

关 键 词:概率阈值准则  马尔可夫策略  最优化算法  Markov决策过程  Markov最优策略
文章编号:1672-6197(2004)01-0062-04
修稿时间:2003年10月14

Optimum algorithm of Markov optimum policy under probability threshold rule
JIANG Feng,ZHENG Zhao-qing.Optimum algorithm of Markov optimum policy under probability threshold rule[J].Journal of Shandong University of Technology:Science and Technology,2004,18(1):62-65.
Authors:JIANG Feng  ZHENG Zhao-qing
Institution:JIANG Feng~1,ZHENG Zhao-qing~2
Abstract:The arithmetic problems of the Markov optimum solution are discussed under the new principle. The markov optimum policy is gained bared on the previous accumulation value.
Keywords:Markov decision processes  Markov optimum policy  probability threshold rule
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号