首页 | 本学科首页   官方微博 | 高级检索  
     

在概率阈值准则下马尔可夫策略的最优化算法
引用本文:姜峰,郑兆青. 在概率阈值准则下马尔可夫策略的最优化算法[J]. 山东理工大学学报:自然科学版, 2004, 18(1): 62-65
作者姓名:姜峰  郑兆青
作者单位:菏泽师范专科学校,教务科,山东,菏泽,274015;山东理工大学,外事学院,山东,淄博,255049
摘    要:在一种新的概率阈值准则下讨论马尔可夫决策的最优解的算法问题.采用基于增益的过去累积值的方法,求解马尔可夫最优策略.

关 键 词:Markov决策过程  Markov最优策略  概率阈值准则
文章编号:1672-6197(2004)01-0062-04
修稿时间:2003-10-14

Optimum algorithm of Markov optimum policy under probability threshold rule
JIANG Feng,ZHENG Zhao-qing. Optimum algorithm of Markov optimum policy under probability threshold rule[J]. Journal of Shandong University of Technology:Science and Technology, 2004, 18(1): 62-65
Authors:JIANG Feng  ZHENG Zhao-qing
Affiliation:JIANG Feng~1,ZHENG Zhao-qing~2
Abstract:The arithmetic problems of the Markov optimum solution are discussed under the new principle. The markov optimum policy is gained bared on the previous accumulation value.
Keywords:Markov decision processes  Markov optimum policy  probability threshold rule
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号