首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
本文将策略迭代-逐次逼近法改进以后直接应用到部分可观的马尔可夫决策规划问题中,得到一个新的逐次逼近算法。算法保证能求出一个ε-最优的平稳策略。  相似文献   

2.
本介绍了以决策理论和计算机模拟理论为基础,采用计算机图形学和信息管理等先进技术,研制的用于在煤矿企业优化编制采掘生产计划及动态仿真系统软件的研究与应用。  相似文献   

3.
矿井采掘计划的最优控制和智能决策支持系统   总被引:1,自引:0,他引:1  
在采掘计划已经编制的条件下,针对矿井经常出现的采掘失调问题,通过网络模模型对采区与水平的各项准备工作进行管理,从时间上对采掘计划进行最优控制,并应用智能技术,建立了知识库,为采掘计划调整提供了决策支持。  相似文献   

4.
本文应用离散时间的马尔可夫决策规划(MDP)的原理和方法,建立了农田灌溉的MDP模型。同时,给出了求解(择优)的算法,并对一个简化的例子进行了实际求解。最后,讨论了模型的进一步发展。  相似文献   

5.
为解决决策网络计划中随机样本空间变化而产生的模型表达上的困难,提出经拓展能够描述多个样本空间的决策单元结构.将随机规划理论引入决策网络计划的优化中,建立了新的考虑期望成本与风险等综合因素的数学模型,并通过算例实现了对模型的求解.计算结果表明:经拓展后的决策单元结构及相应的优化模型能够更为有效地解决不同样本空间下的决策问题,具有较高的理论意义与实用价值.  相似文献   

6.
为了实现地下金属矿山采掘作业计划编制的实时准确与科学有效性,针对矿山作业地点分散、生产组织复杂、矿石质量难以控制等特征,构建了基于0-1整数规划的作业计划优化模型.通过分析开采技术经济指标及空间逻辑关系,以最小品位偏差为目标,将产量均衡、出矿能力以及品位高低结合开采等转化为约束条件,考虑各采场作业工序、回采顺序、生产能力以及其他生产要素等,运用计算机技术和整数规划方法,得出地下矿山采掘作业计划最优方案.以国内某大型金矿为案例进行了模型的有效性验证,解算出矿山最优的采掘作业计划,并得出作业计划甘特图.结果表明,模型能够指导完成生产作业任务,且满足作业计划连续性和均衡性要求.  相似文献   

7.
徐芳 《科技咨询导报》2009,(14):194-194,197
矿井采掘规划管理系统是煤矿生产中所进行的采煤计划和掘进计划辅助编排工作。基于煤矿中常用的计划编排方式,实现采掘计划从编排到绘制AutoCAD图形信息的管理和控制系统。本技术在许厂煤矿取得了良好的效果。  相似文献   

8.
9.
对于状态空间为可列集、行为空间为任意非空集、报酬函数为有界的折扣模型,本文用初等方法反而比用传统方法更快地获得了标准的结果:存在一个平稳策略是ε最优的;最优值函数是最优方程的唯一有界解。这表明用初等方法来研究该模型ε(≥0)最优策略的性质和结构是完全可行的。  相似文献   

10.
该文针对多无人机在复杂环境下执行作战任务易受环境威胁影响的问题,提出一种基于改进马尔可夫决策过程模型的多无人机航路规划算法.利用离散化雷达威胁信息,设计多无人机作战环境与状态空间数目;将目标点方位空间离散化,进而合理分配状态转移概率;将雷达威胁与马尔可夫决策过程模型相结合,在无模型均匀结构的报酬函数基础上引入非均匀结构...  相似文献   

11.
在有限马尔可夫决策过程的线性规划求解方法以及神经网络算法的基础上提出了运用神经网络求解有限马尔可夫决策问题的方法.并通过算例验证了该方法的有效性.  相似文献   

12.
吴晓丹  何金  李娟 《科学技术与工程》2022,22(22):9516-9523
为合理匹配医疗检查任务,提高医生服务质量和医院收益,针对医疗检查即时预约调度问题,考虑医生资质和患者病情差异,以最大化医院收益为目标建立基于马尔可夫决策过程(Markov decision process, MDP)的匹配预约调度模型,并采用逆序值迭代算法对模型进行求解。最后通过仿真实验得到不同资质医生接受不同病情患者的最优预约策略,并与传统先到先服务(first come first service,FCFS)预约策略进行对比分析。结果表明,MDP预约策略是与医生剩余可服务患者数相关的阈值策略,该策略相比于FCFS预约策略所获收益更高,更有利于保障医院稳健运营,且在医疗检查资源越匮乏时MDP预约策略的优势越明显。  相似文献   

13.
为了保证企业投资决策最优的投资效果,企业应把投资决策过程分为多个阶段.建立了以获得利润最大化,同时把投资总风险控制在可承受范围内为目标的基本动态规划模型.该模型把一个多阶段的投资问题转化为多个单阶段的问题,从而求解整个投资阶段的最优决策问题就转化成求解一系列单个投资阶段中的最优问题.  相似文献   

14.
讨论了向量值离散时间平均准则下的有限马氏决策模型;在采取确定性平稳策略时所得马氏决策过程为遍历的假设下,证明了存在一个至多在K-1个状态是随机的平稳最优策略,并给出了其线性规划算法。同时证明了存在强最优策略的充要条件是其存在强确定性平稳最优策略。  相似文献   

15.
本文建立了一类无界向量值报酬折扣马氏决策规划,在一组无关向量生成的凸锥确定的序关系下,讨论了模型最优策略的存在性;给出强最优策略存在的必要充分条件;指出最优策略的自组合、凸组合策咯仍是最优策略;还证明了平稳策略在一般策略类中的优势。  相似文献   

16.
论文在Markov性能势理论基础上,研究了Markov控制过程在神经元网络等逼近结构表示的随机平稳策略作用下的仿真优化算法,分析了它们在一个无限长的样本轨道上概率1的收敛性,并给出了一个三-状态受控Markov过程的数值实例。  相似文献   

17.
需求不确定下船队规划决策的鲁棒优化模型   总被引:1,自引:0,他引:1  
研究了不确定复杂环境下的船队规划决策问题.在分析船队规划已有研究方法和基本特点的基础上,将船舶调配优化与船队发展规划结合起来统筹研究,建立了符合市场实际的多方式投资的船队规划确定性模型.通过引入基于情景分析的鲁棒优化方法,采用具有已知概率的情景集合描述市场需求的不确定性,将此模型扩展为包含不确定因素的鲁棒优化模型.模型既考虑了船舶营运经济状态、企业投资能力、新船购置、二手船买卖、船舶租赁等多种复杂的实际情况,又考虑了需求的不确定性影响,并且体现了模型的鲁棒性.最后,以某航运公司为例进行仿真实验,将确定性模型与鲁棒模型进行对比,结果表明,鲁棒模型的解相对保守,能有效地保证船队规划决策的鲁棒性.  相似文献   

18.
本文在文献[1]~[3]的基础上,建立了一般意义下的预序模型,并研究了该模型最优策略的结构。文中彻底放弃了状态转移是确定性的假设,将策略从确定性策略类Π~d放宽到一般的随机策略类Π上进行讨论,从而大大地推广了文献[4]的结果。  相似文献   

19.
提出了一种有限规划水平部分可观、不确定Markov决策过程自适应决策算法.算法的基本思想是运用Bayes理论对未知系统进行"学习”,通过最小决策失误概率的参数决策实现参数估计,在参数估计的基础上进行控制决策从而以最大概率实现最优决策.文中证明了决策算法的收敛性.仿真结果表明了决策算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号