首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到14条相似文献,搜索用时 62 毫秒
1.
根据等价Markov过程方法,研究了一类半Markov控制过程在紧致行动集上关于无限水平平均代价准则的性能优化算法.由于实际系统的状态空间往往非常大,因此通常的串行仿真算法可能会耗时过长,或由于硬件限制而无法实现.针对这些问题,提出了一种基于性能势的并行仿真优化算法,以期寻找系统的最优平稳策略,并用该算法对性能势的仿真和策略寻优分别进行了并行化,获得了较好的运行效率.仿真实例表明了该算法的有效性.这一算法可应用于大规模实际半Markov系统的性能优化.  相似文献   

2.
连续时间Markov控制过程的平均代价最优鲁棒控制策略   总被引:2,自引:0,他引:2  
在Markov性能势基础上 ,研究了一类转移速率不确定但受紧集约束的遍历连续时间Markov控制过程 (CTMCP)的鲁棒控制问题 .根据系统的遍历性 ,平均代价Poisson方程的解可被看作是性能势的一种定义 .在平均代价准则下 ,优化控制的目标是选择一个平稳策略使得系统在参数最坏取值下能获得最小无穷水平平均代价 ,据此论文给出了求解最优鲁棒控制策略的策略迭代 (PI)算法 ,并详细讨论了算法的收敛性 .  相似文献   

3.
论文在Markov性能势理论基础上,研究了Markov控制过程在神经元网络等逼近结构表示的随机平稳策略作用下的仿真优化算法,分析了它们在一个无限长的样本轨道上概率1的收敛性,并给出了一个三-状态受控Markov过程的数值实例。  相似文献   

4.
在一种新的概率阈值准则下讨论马尔可夫决策的最优解的算法问题.采用基于增益的过去累积值的方法,求解马尔可夫最优策略.  相似文献   

5.
提出了一种基于Markov随机游走的渐进式半监督分类模型:在随机游走过程中,计算待标注数据到各类的迁移概率时,只考虑相应类别样本的影响,而忽略其他类别样本对随机过程的影响;并在学习过程中借鉴渐进学习思想,通过不断地“纠正”半监督学习过程中的“错误”,从而提高模型的预测精度.在20newsgroups数据集上的实验结果表明:所提出的方法能够提高半监督分类的精度.  相似文献   

6.
讨论平均报酬参数马氏决策过程的随机梯度算法,利用与折扣报酬的关系,给出了目标函数的梯度的一个新的表达式.同时得到了基于单一样本路径的随机逼近算法,最后证明了算法以概率1收敛到其梯度.    相似文献   

7.
针对当前异构无线网络垂直切换算法存在切换次数多, 服务质量难以满足实际应用需要的问题, 以获得更优的异构无线网络服务质量为目标, 提出一种基于改进Markov过程的异构无线网络垂直切换算法. 首先, 建立异构无线网络整体性能评价指标体系, 然后采用灰色关联分析法确定网络整体性能评价指标的权重值, 最后利用Markov决策过程对异构无线网络的状态进行预测, 选择最优的接入网络, 并通过异构无线网络垂直切换的仿真对比实验测试和分析其性能. 实验结果表明, 相对其他异构无线网络垂直切换算法, 该算法可降低平均切换次数, 避免了频繁切换现象的发生, 大幅度减少了网络数据传输的丢包率, 改善了用户满意度, 获得了更高的服务质量.  相似文献   

8.
对一类半Markov过程引进某伴随鞅,得到了过程首次通过状态0的一些结果,最后给出了停时的表达式。  相似文献   

9.
从连续时间Markov链(CTMC)性能势的角度,借助于定义的折扣Poisson方程,给出了CTMC基于性能势的灵敏度公式及折扣代价准则(简称折扣准则)下的最优性方程.此外,建立了在折扣准则与无穷时间平均代价准则(简称平均准则)下灵敏度公式及最优性方程之间的联系.  相似文献   

10.
基于Markov链的MCUSUM控制图链长分析   总被引:1,自引:0,他引:1  
平均链长(ARL)作为评价控制图性能的一个重要指标,对其进行深入的研究是控制图参数设计、性能评价及实际应用的基础。在多元向量累积(MCUSUM)控制图的基础上,研究了样本协方差已知、过程受控条件下该控制图的ARL以及链长分布的计算方法。采用Matlab计算平台,该文给出了该方法以及仿真法的程序实现,对比研究了两种方法的计算结果及算法收敛性。研究表明Markov链法为渐进收敛,适用于控制图的参数设计和链长的分布计算;仿真法为波动收敛,其更适用于过程存在偏移时控制图的ARL计算。  相似文献   

11.
本文利用矩阵的奇异值分解理论,推导控制律的另一种实现,使改进后的预测控制算法中的参数设计有一定的理论数据可参考,该算法尤其适合于病态的动态矩阵,使参数设计大为简化。文中还给出了仿真实例。  相似文献   

12.
一种基于负载的短信中心性能优化策略   总被引:1,自引:1,他引:1  
随看短信业务的迅猛发展,短信中心的性能问题也逐渐浮出水面.在系统高负载,甚至超载下怎样保证短信中心能够正常运行并维持较好的性能成为了引人注目的焦点,本文针对其原有的按时重发策略在系统高负载时容易因为重发造成系统超载的缺点,提出了一种新的具有负载适应性的短信重发策略——基于负载的重发策略.该策略通过将系统的首次下发短信与重发短信的下发流量进行错峰,将系统下发流量控制在系统设置的阀值之内;在接近系统处理能力的高负载环境下可以有效减少拥塞的发生,从而提高短消息中心在高负载下的可靠性与性能.  相似文献   

13.
大时滞二阶过程内模预测控制系统设计   总被引:1,自引:1,他引:0  
带有大时滞的双容过程是常见的二阶工业过程,由于过大的时滞使系统难以控制。针对一类带有大时滞的双容过程,采用内模控制系统结构,使系统具有良好的抗扰性和鲁棒牲。给出了在希望的幅值和相角裕量下控制器参数的计算方法。设计例子与仿真结果表明,根据该方法设计的系统有比较满意的稳定性和鲁棒性。  相似文献   

14.
多台冷水机组联合运行系统的最佳性能系数(COP)   总被引:3,自引:0,他引:3  
根据空调负荷连续性和冷水机组承担负荷非连续性的特点,以及冷水机组的性能系数(COP)与其部分负荷率R有关的特性,提出一种基于最佳COP的冷水机组负荷分配方法.采用回归方法获得冷水机组R与COP的关系并建立机组能耗目标函数,利用序贯加权因子法获得最佳的负荷分配率.将该方法用于多台冷水机组联合运行系统的在线运行控制.试验结果表明,该优化控制策略优于常规的负荷等额分配控制或区间负荷比例分配控制策略.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号