首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
主要针对带有饱和执行器的时滞非线性离散时间系统更加一般的形式,通过启发式动态规划(HDP)算法求解无限时间最优控制策略问题,并在值函数中引入折扣因子.首先通过迭代HDP算法给出值函数序列和相应的控制序列,并给出了收敛性证明,即值函数序列收敛到值函数的最优值,以及控制序列收敛到最优控制;其次为了实现HDP算法,引入3个神经网络:模型网络、评判网络、控制作用网络.模型网络用来近似系统模型,评判网络用来近似值函数,控制作用网络用来近似控制;最后通过一个仿真例子说明上述方法的可行性.  相似文献   

2.
对抽象约束优化问题的序列近似方法的收敛性进行讨论,证明了在目标函数序列连续收敛和约束集合序列收敛的条件下,序列近似问题的全局最优值收敛到原问题的最优值.进一步,证明了在序列近似问题目标函数和约束集合具有某些单调性质的前提下,把目标函数序列连续收敛减弱到上图收敛,该结论仍然成立.最后,将这一结果用于分析互补约束优化问题的光滑化方法的收敛性中.  相似文献   

3.
针对萤火虫算法在求解高维复杂函数时存在的收敛速度慢、寻优精度低和易陷入局部最优等缺点,提出一种融合多策略的萤火虫算法(IMSFA)。首先,利用混沌映射和动态对立学习策略优化初始种群,加快算法的收敛速度;其次,对个体的移动策略进行多样化设计,降低算法陷入局部最优的概率,提高算法的寻优精度;最后,对超出解空间的个体使用归优边界限制策略,保证算法可以朝着一个较优的方向进行搜索。在8个基准函数上对IMSFA进行优化测试,并使用Wilcoxon秩和检验对其进行评估,结果表明,IMSFA在收敛速度、搜索精度、克服局部最优和寻优稳定性方面有着出色的表现。  相似文献   

4.
概率约束优化问题通常是非凸且非光滑的,因而在数值计算上存在困难.基于Pinar-Zenios光滑和函数,建立了概率约束优化问题的一个光滑D.C.近似问题,提出了求解光滑D.C.近似问题的序列凸近似(SCA)算法,分析了初始解的选取方法,并讨论了算法的收敛性,收敛定理表明可以由SCA算法可以得到光滑D.C.近似问题的KKT点,并且在迭代过程中,确保了由SCA算法生成的解序列的极限点是近似问题的KKT点.  相似文献   

5.
本文提出测度值马尔可夫决策过程新模型.在此模型下,agent对环境的把握用测度概念来表示,于是agent则根据测度来决定自己的最优行动以得到最优策略,因此本文也提供了测度值马尔可夫决策过程的最优策略算法.该模型是部分可观察马尔可夫决策过程的推广,它反映人类思维的一个重要特征,人们在把握全部状态可能性(即对状态空间进行权衡度量)的态势下,思考问题并选择自己的最优行动.部分可观察马尔可夫决策过程只是它的一种特例.  相似文献   

6.
为优化双供应商情形下的设备维护和备件订购联合决策,以多零件并行制造系统为对象,采用泊松过程刻画零件的随机退化,基于马尔科夫决策过程对零件替换和备件订购联合决策进行建模,基于设备状态信息和库存状态信息建立系统状态的转移概率,以最小化系统平均总成本为目标,通过值迭代算法求取最优的设备维护和备件订购联合决策.在此基础上为提高计算效率,缩短求解时间,基于序列优化的方法设计启发式策略,通过双零件系统分析了最优策略和启发式策略的决策差异.敏感性分析结果显示,相比最优策略,启发式策略可以在成本增加率不超过5%时减少计算时间.  相似文献   

7.
针对标准粒子群算法在处理复杂函数时存在的收敛速度慢、易陷入局部最优的缺点,提出了新的混合粒子群算法.该算法利用混沌运动的遍历性、对初始条件的敏感性等特性进行群体的混沌初始化,且捕食搜索策略可以通过调节限制级别的控制粒子群的搜索空间,从而平衡全局搜索和局部搜索.测试结果表明,新算法具有更快的收敛速度和更强的全局寻优能力.  相似文献   

8.
提出了一类带有概率约束的稀疏线性回归模型,一定程度上改善了经典模型的不足.通过概率和数学期望的关系,以及非负实数集合的指示函数可以用两个凸函数之差近似的性质,建立了其保守近似模型,同时建立了近似模型和原模型的最优解集合,稳定点集合之间的收敛关系.为了求解近似模型,利用凸函数差的性质,建立了序列凸近似算法,并证明了其收敛性.注意序列凸近似的子问题是随机优化问题,其中随机变量可以用Monte Carlo随机抽样进行近似.可以证明Monte Carlo近似问题的结果以概率1收敛到序列凸子问题.最后数值实验说明了该方法的有效性.  相似文献   

9.
蚁群算法在连续性空间优化问题中的应用   总被引:1,自引:0,他引:1  
研究了一种可用于求解连续空间优化问题的蚁群算法策略.能提高最优解搜索过程的效率以及搜索状态的多样性和随机性,且不受优化目标函数是否连续、可微等因素的限制,为实际应用提供了途径.数值算例结果表明该搜索策略能较好地找到近似全局最优解.  相似文献   

10.
针对室内到达时间差(time difference of arrival, TDOA)位置估计中的非线性最优化问题, 提出用改进的樽海鞘群算法搜索目标位置. 通过选择最优主基站构造改进的适应度函数, 使适应度函数可以更好地反映解的优劣程度, 提高了搜索精度. 在初始樽海鞘种群中引入近似解, 使全局搜索的步骤得到简化, 加快了算法前期收敛速度. 采用自适应跟随策略更新追随者位置, 解决局部开发低效问题, 加快了算法后期收敛速度. 仿真结果表明, 基于改进樽海鞘群算法的 TDOA 定位技术相比其他元启发式算法具有更高的定位精度和更快的收敛速度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号