共查询到20条相似文献,搜索用时 15 毫秒
1.
对广泛存在的一类事件驱动的平均费用型马尔可夫决策问题,通过分析其模型特征,研究了一种简单的增强型学习算法,不必将事件扩充为系统状态,而只对原始状态的值函数进行学习,减少了计算量和数据存储量。将算法应用于M/M/1排队系统的接纳控制问题,计算机仿真结果表明,算法优于通常的增强型学习和动态规划方法,验证了算法的有效性。 相似文献
2.
基于分层马尔可夫决策过程的AUV全局路径规划研究 总被引:1,自引:0,他引:1
自主路径规划是自治式水下机器人(AUV)自主能力的重要体现,是保障AUV在大范围复杂海洋环境中自主完成使命作业的关键技术之一。提出了基于马尔可夫决策过程的路径规划方法;并建立了基本的马尔可夫决策模型和结合状态聚类的分层马尔可夫决策模型,同时给出了两种规划的仿真实验及结果分析。实验证明,此类方法能够很好地求解大范围复杂环境内AUV的二维路径规划问题。 相似文献
3.
《系统科学与复杂性》2021,(5)
Several decades ago, Profs. Sean Meyn and Lei Guo were postdoctoral fellows at ANU,where they shared interest in recursive algorithms. It seems fitting to celebrate Lei Guo's 60 th birthday with a review of the ODE Method and its recent evolution, with focus on the following themes:The method has been regarded as a technique for algorithm analysis. It is argued that this viewpoint is backwards: The original stochastic approximation method was surely motivated by an ODE, and tools for analysis came much later(based on establishing robustness of Euler approximations). The paper presents a brief survey of recent research in machine learning that shows the power of algorithm design in continuous time, following by careful approximation to obtain a practical recursive algorithm.While these methods are usually presented in a stochastic setting, this is not a prerequisite. In fact,recent theory shows that rates of convergence can be dramatically accelerated by applying techniques inspired by quasi Monte-Carlo.Subject to conditions, the optimal rate of convergence can be obtained by applying the averaging technique of Polyak and Ruppert. The conditions are not universal, but theory suggests alternatives to achieve acceleration.The theory is illustrated with applications to gradient-free optimization, and policy gradient algorithms for reinforcement learning. 相似文献
4.
In this paper,we provide a new theoretical framework of pyramid Markov processes to solve some open and fundamental problems of blockchain selfish mining under ... 相似文献
5.
决策支持系统中决策问题的识别方法 总被引:2,自引:0,他引:2
本文概要地介绍了按决策思维方式进行DSS集成化设计的决策支持过程,并在此基础上,探讨了一类支持制定决策方案(规划与计划)的决策支持系统中,决策问题的发现与构成方法。 相似文献
6.
7.
ISAR运动补偿的快速方法 总被引:6,自引:0,他引:6
本文提出的一种新的ISAR运动补偿方法,是在文献[1]的复相关包给对准及相位中心对准补偿方法基础上进行改进的。这种方法减少了运动补偿的运算量,提高了距离和相位对准的精度,并能显著地改善回波信号起伏时的目标成像质量。 相似文献
8.
Two New Methods for Multiattribute Decision Makings with Information Partially Known 总被引:2,自引:1,他引:1
LI Dengfeng Department of Basics Dalian Naval Academy Dalian Liaoning China 《系统科学与系统工程学报(英文版)》1998,(1)
TwoNewMethodsforMultiatributeDecisionMakingswithInformationPartialyKnown⒇LIDengfengDepartmentofBasics,DalianNavalAcademy,Dali... 相似文献
9.
求解群体多目标决策问题的一种方法 总被引:1,自引:0,他引:1
引进了群体多目标决策问题的一种新的最优解概念──s-最优平衡解,它的实际意义是对于每个决策者而言在每个目标下都给出一个让步值.证明了求解s-最优平衡解等价于求解一个对应的单目标优化问题,并在一定条件下s-最优平衡解总是存在的.讨论了具有不同让步值的s-最优平衡解.数值例子表明这个方法对解决群体多目标决策问题具有一定的有效性. 相似文献
10.
战术导弹对单个目标射击效能的马氏链决策分析模型 总被引:1,自引:0,他引:1
针对多发导弹攻击单个坚固目标时毁伤效能分析与评估这一复杂问题,运用马尔可夫过程理论建立了独立连射方式下多发战术导弹射击效能分析的马氏链模型.对于各发导弹精度、威力相同且不计毁伤积累的射击情形,建立目标毁伤过程的时齐马氏链模型,定量分析目标毁伤状态的变化;对于各发导弹精度、威力不同或考虑目标毁伤积累的射击情形,建立目标毁伤过程的非时齐马氏链模型;当考虑目标恢复时,建立由目标毁伤过程马氏链和目标修复过程马氏链组成的混合马氏链模型. 相似文献
11.
信道估计是CDMA系统中的关键技术 ,涉及到对用户信号传播信道的幅度、相位和延时的估计。提出了对一个进入CDMA系统的新用户进行快速最大似然多径信道参数估计的方法。实验结果对比表明 ,本方法捕获性能好 ,且捕获的速度更快 相似文献
12.
Markov控制过程是研究随机离散事件动态系统性能优化问题的一个重要模型,并在许多实际工程问题中有着广泛的应用。在Markov性能势理论的基础上,我们讨论了一类连续时间Markov控制过程在紧致行动集上的性能优化仿真问题。由于实际系统的状态空间往往非常巨大,通常的串行仿真算法,可能耗时过长,也可能由于硬件限制而无法实现,故我们提出了一种基于性能势的并行仿真优化算法,来寻找系统的最优平稳策略。一个仿真实例表明该算法有较好的运行效率。该算法可应用于大规模实际系统的性能优化。 相似文献
13.
14.
一种Fuzzy多属性决策模型 总被引:5,自引:0,他引:5
实际中的决策问题常常具有许多不确定性。本文建立了一种具有模糊权及模糊属性值的多属性决策模型。在模糊数的排序方法及线性运算法则的基础上,本文给出了该模型的求解方法。各方案的排序是依据其到模糊理想解的模糊距离大小进行的。 相似文献
15.
16.
一种两层多目标决策方法 总被引:1,自引:0,他引:1
一种两层多目标决策方法夏洪胜,盛昭瀚,徐南荣(厦门大学系统科学系,361005)(东南大学管理学院,南京210018)ATwo-levelMultiobjectiveDecisionMakingMethodXiaHongsheng(XiamenUni... 相似文献
17.
求解群体多指标决策问题的偏爱度法 总被引:16,自引:0,他引:16
对于离散的群体多指标决策问题,本文引进方案的优距数和劣距数,利用它们导出并定义了群体关于方案的偏爱度的计算公式和概念.以此为基础,本文给出一个对离散群体多指标决策问题进行排序的有效方法. 相似文献
18.
罗吉庭 《系统工程与电子技术》1992,(11)
假设各部件的寿命分布和修理时间分布都为指数分布,且分布参数已知,本文用蒙特卡罗方法计算了单部件、双部件和三单件构成的串联、并联和串并联系统的可靠度、瞬时可用度、稳态可用度和故障频度等特征数量指标。为了检验蒙特卡罗模拟结果的准确程度,同时给出解析结果与之对比,表明该方法应用的正确性。 相似文献
19.
20.
为满足合成孔径雷达(synthetic aperture radar,SAR)在海洋遥感的应用需求,提出一种舰船目标SAR成像的快速仿真方法。对成像场景中重点关注的目标进行精确电磁建模,并利用"四路径"模型计算目标与海面的复合散射回波,对海面背景采用散射面元法计算回波;将舰船复合散射回波与海面回波进行合成得到总的SAR回波,利用聚束SAR成像处理方法获得SAR图像。结果表明:该算法避免了对整个成像区域进行复杂的电磁仿真,能够有效降低对海面大场景的电磁计算效率。由于在目标区域采用高频电磁算法,保留了目标的电磁散射的精细结构,为精确模拟SAR回波提供了一种准确而高效的仿真算法。 相似文献