首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 562 毫秒
1.
针对可伸缩视频流在无线通信中的数据包调度问题,提出了一种基于部分可观测马尔可夫决策过程(POMDP)的决策调度策略,在用户状态不确定或部分可观测条件下,采用POMDP建立了完整的最优化调度模型,以实现视频接收质量的最佳化.仿真实验结果表明,与传统的调度算法相比,该方法有效提高了视频流的平均峰值信噪比(PSNR).随着调度规模的扩大,其性能能够逐渐逼近用户状态完全确定的理想马尔可夫决策过程(MDP)模型.  相似文献   

2.
多状态退化系统最优故障维修策略   总被引:1,自引:0,他引:1  
针对多状态半马尔可夫退化系统,研究了系统发生故障后的维修模型.在系统的退化过程中,有多个不可逆的工作状态和故障状态.系统的所有故障均能修复且可忽略故障修复时间,修复后系统回到正常的工作状态.当系统发生故障时,系统的故障检测设备首先确定出当前所处的故障状态,然后采取相应的维修措施.基于系统长期平均成本率最低的决策准则,运用半马尔可夫决策过程的策略迭代算法给出了系统处于不同故障状态下的最优维修策略.以实例说明了求解最优故障维修策略的迭代过程.  相似文献   

3.
针对监测费用昂贵导致难以实施连续监测和维修效果通常不完美的问题,研究了维修效果不完美情形下部分可观测系统的最优维修策略.在假设系统的性能退化状态变化规律可以用马尔可夫链进行描述的基础上,利用部分可观测马氏决策过程对该系统进行维修决策建模,并通过引入信息状态将其转化为完全可观测马氏决策过程;引入维修效果矩阵用以刻画维修效果对最优维修策略的影响;针对所建立的最优方程以单位时间期望维修费用最小为目标设计了最优维修决策算法.通过数值仿真验证了所提算法的有效性.  相似文献   

4.
集值测度、随机集与集值随机过程是测度论、概率论与随机过程的进一步扩充。1964年,R.J.Aumann与K.Vind分别研究了集值映射与集值集映射。1972年Z.Artstein系统地研究了集值测度。1977年,F.Hiai等人研究了集值鞅。这就使集值映射在随机数学中得到发展。本文概括了作者近几年在这方面的研究成果。  相似文献   

5.
给出了观察过程状态数为可数时,部分可观的马尔可夫决策规划(POMDP)折扣模型的逼近法和算法,算法保证了能求到ε-最优的平稳策略和ε-最优的期望费用函数。  相似文献   

6.
近年来涌现了许多把深度强化学习应用到股票交易策略的研究。深度强化学习通常依赖于马尔可夫决策过程建模,但是股票市场中交易策略的制定需要考虑历史交易数据中包含的信息。因此,本文通过部分可观察马尔可夫决策过程对股票市场建模,并采用长短期记忆网络和优势演员评论家算法来构建股票交易策略。通过在道琼斯工业平均指数成份股数据集上进行实验,实验结果表明本文所设计的股票交易策略构建方法可以挖掘隐藏在历史数据中的有效信息,获得稳定且有效的交易策略。  相似文献   

7.
通过部分可观测马尔可夫决策过程(POMDP)模型对用户意图进行建模,提出了一种基于POMDP用户意图建模的智能轮椅导航控制方法.该方法考虑了动作的不确定性和状态的部分可观测性,对用户意图、智能轮椅导航控制的动作空间进行建模,通过状态预测进而选择行为的最优规划,实现用户期望总值的最大化.首先介绍了POMDP的原理及模型,然后提出了基于POMDP用户意图的智能轮椅控制状态空间、动作空间、观察值集合、奖赏值和概率分布,进而提出了一种基于概率密度函数的用户意图求解方法.最后,对基于POMDP用户意图建模的智能轮椅导航控制进行了试验,并对试验结果进行了分析,从而验证了所提方法的实时性和有效性.  相似文献   

8.
在一种新的概率阈值准则下讨论马尔可夫决策的最优解的算法问题.采用基于增益的过去累积值的方法,求解马尔可夫最优策略.  相似文献   

9.
利用基于部分可观马尔可夫决策过程的策略搜索模型,提出了一种具有优化行为的策略搜索算法,并推导出满足匹配律的策略算法.被试可通过调整策略参数,最大化目标值函数的期望值,并根据已往的经验调整策略参数.假定被试所处的环境具有马尔可夫性,通过计算值函数期望值的梯度可求得优化行为的策略搜索算法.理论分析与仿真结果表明,如果策略参数与值函数的期望值仅受当前经验的影响,则可由获得优化行为的策略算法推导出符合匹配律的策略算法.研究结果揭示了匹配行为与优化策略搜索算法之间的关系,表明满足匹配律的决策行为是一类达到次优的决策行为.  相似文献   

10.
【目的】在分析了期望最大化准则无法控制方差的局限性的基础上,考虑具有风险厌恶型决策人的有限阶段马尔可夫决策过程,为风险厌恶决策者提供决策方法。【方法】建立了悲观准则下有限阶段马尔可夫决策过程的数学模型,并基于动态规划原理和同向不等号相加的保号性给出了向后递推算法。【结果】得到了每个阶段所有可能状态的最优策略和到阶段结束至少可获得的报酬,并证明所得到的最优策略矩阵满足风险厌恶型决策者的要求。然后,针对连续性策略、成本最小化和风险偏好型决策者等情形下有限阶段马氏过程最优策略的求解进行了一些理论延伸。【结论】给出了一个三阶段马尔可夫过程的算例分析,验证了所提出的模型。  相似文献   

11.
图集的统一协调,对图集质量有很大影响。本文是作者在编制北京市农业区划地图集的实践基础上,根据地图信息传输论的观点,对农业区划地图集的统一协调的内容及方法进行了探讨。试图总结编制这类图集的统一协调模式,以供读者编图时参考。  相似文献   

12.
研究了国家法的抽象正义观与民间法的情理正义观,认为西方国家法的抽象正义观与东方民间法的情理正义观存在实质的不同,原因在于思维方式、超验与经验传统、政治结构的差别。在现代法治理念下,传统民间法所代表的正义观将向混合正义观转型,西方法治所代表的国家法抽象正义观是其骨架。  相似文献   

13.
给出了一维非自治时滞系统点态退化的一个例子,拓宽了该领域的研究。  相似文献   

14.
利用对位异构体的对称性由核磁共振氢谱测定了工业十二烷基苯在硝硫混酸中的硝化选择性,发现一硝化产物中对位异构体的比例为75% ̄80%。以月桂酸和苯为原料,经氯化、酰化和还原合成了正十二烷基苯。在同样条件下研究了正十二烷基苯的硝化,由核磁共振氢谱和气相色谱分析,发现一硝化产物中对位异构体的比例仅为60%。根据空间位阻效应,对结果进行了讨论,并与甲苯,乙苯,异丙苯等短链烷基苯的硝化结果进行了比较。  相似文献   

15.
YBCO掺杂效应研究   总被引:3,自引:0,他引:3  
介绍了YBCO掺杂的基础知识,总结了YBCO各个位置采用典型元素掺杂而导致的超导电性和结构的变化,阐述了掺杂对YBCO的重要影响,并简介了当前YBCO掺杂效应研究中的几个热点问题.  相似文献   

16.
由于有限群的Lagrange定理的逆不成立,因此,n较大时要确定n次交代群An的所有子群或对An阶数的每一个正因数,确定是否存在这个阶数的子群是较困难的问题.文章通过对5-循环置换各次方幂的计算及其研究,构造出了A5的5个12阶子集,并证明了每一个子集都是A5的12阶子群,最后对A5的部分阶的子群做了总结.  相似文献   

17.
18.
为了找出诱发高频机组基础不良振动的原因,从基础计算模型方面对基础激励与响应进行了分析,以两个高频机组基础为动测实例,经模态分析得出钢筋混凝土构架式基础竖向1阶振动与电机产生共振;应用功率谱法对动力机组及基础平台进行动测,得出平台异常响应频率66Hz为水泵工作频率,调整机器的工作频率可避开不良振源影响,达到明显的减振效果。由此而知,动力机器基础出现不良振动时,不可盲目改变结构的动力特性,应在机器不同工况比如:停机、起机及正常转速下,对机器及基础进行动测并对振动信号进行比较分析,以制定出行之有效的减振方法。  相似文献   

19.
基于“前沿分支”的观点研究了圈幂补图的树宽,首先确定了它的树宽下界,又给出了达到此下界的标号,从而得到了它的树宽表达式。  相似文献   

20.
报告鸡法氏囊病的流行状况,主要症状,剖检情况及诊断,提出了综合性防治措施。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号