首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 343 毫秒
1.
研究了一类带有输入受限的领导者-追随者多智能体系统的同步最优控制问题。该问题可以看作是一个图博弈问题。基于图博弈理论,首先为每个智能体定义了一个带有非二次型能量函数的性能指标,该性能指标同时依赖于智能体自身及其邻居的信息。然后,利用所定义的性能指标建立耦合的哈密顿-雅克比-贝尔曼(HJB)方程。通过求解HJB方程得到最优控制策略,使得每个追随者同步于领导者且最小化给定的性能指标。由于HJB方程的解析解难于获得,因此借助于强化学习方法利用Actor-Critic(A-C)神经网络在线学习得到近似最优解。通过稳定性分析可以证明所得近似最优控制策略使得闭环系统所有状态一致最终有界,并且收敛到交互纳什均衡。最后,通过仿真实验验证所提同步最优控制算法的有效性。  相似文献   

2.
本文用Fourier变换,得到有界区域上Schroxdinger算iΔ所生成的半群的表达式.并用它引进了受控脉冲型Schrodinger方程的PCι-温和解,证明PCι-温和解的存在唯一性.讨论相应的最优控制问题,证明最优控制的存在性,导出最优化的必要条件.  相似文献   

3.
随机利率下有违约风险的最优投资组合   总被引:1,自引:0,他引:1  
通过随机最优控制方法讨论随机利率下有违约风险的最优投资组合问题,用约化形式方法对违约风险建模,假定利率和信用利差都服从Cox-Ingersoll-Ross模型,将最优投资组合问题看作一个三维的随机最优控制问题,给出了相应的Hamilton-Jacobi—Bellman方程的显式解和最优投资策略.  相似文献   

4.
彭云飞 《贵州科学》2011,(1):20-25,31
本文用Fourier变换,得到有界区域上Schroxdinger算iΔ所生成的半群的表达式.并用它引进了受控脉冲型Schrodinger方程的PCι-温和解,证明PCι-温和解的存在唯一性.讨论相应的最优控制问题,证明最优控制的存在性,导出最优化的必要条件.  相似文献   

5.
本文将外罚函数概念作了扩充,建立了用罚函数方法解非线性控制系统相坐标有界最优控制问题的严格的数学基础;证明了在极限情形下,非受限最优控制问题等价于受限最优控制问题。  相似文献   

6.
研究了非方离散广义系统的奇异线性二次指标最优控制问题(即LQ问题).在给定的条件下,给出LQ问题的惟一最优控制和最优状态,并将最优控制综合为状态反馈. 闭环系统的所有有限特征值均在开单位圆内,闭环系统的状态有最少自由元. 并给出非方离散广义系统的最优代价比较定理.  相似文献   

7.
用Fourier变换,得到在有界区域上i△所生成的半群表达式,并用它引进了受控Schr(o)dinger方程的温和解,证明了解的存在唯一性及解对初值和控制的连续依赖性.为Schr(o)dinger方程的最优控制问题的研究打下了基础.  相似文献   

8.
讨论一类用无穷维系统方程描述的最优控制问题,把它看作为Hilbert空间上求算子方程的最小均方解的问题.在无穷维算子近似理论的基础上,用无穷矩阵奇异值分解方法得到无穷维最优控制问题解的形式,并研究这个解的有限维近似形式,建立一个有限的N阶最优控制系统,使得它的控制律与无穷维系统的控制之间误差最小  相似文献   

9.
讨论了在随机收益条件下,具有混合因素(未分配利润和扩股)的最优融资问题.给出了价值函数满足的自由边界,用求解变分方程的方法证明了最优控制的存在性,并找到了最优控制策略.最优控制策略可以用两个临界值来描述:当资产小于较小的临界值时,公司扩股融资,但不分红利;当资产大于较小的临界值时,公司收益全部分红,但不扩股融资;当公司资产介于这两者之间时,不分红,也不扩股.  相似文献   

10.
在股票价格波动服从几何布朗运动规律的条件下,研究了保险公司的一般最优控制问题,得到了一般最优控制问题价值函数的HJB方程,利用鞅方法证明了HJB方程的识别定理,得到了一般最优控制问题中的最优策略。  相似文献   

11.
基于牛顿-共轭梯度(Newton-CG)增广拉格朗日算法, 给出了一种计算机数控(CNC)系统时间最优轨迹规划问题的高效求解方法. 通过非线性变量代换, 时间最优轨迹规划问题被表述为一个固定时间域的凸最优控制问题. 基于扩展极大值原理, 证明了弦误差与分轴加速度约束的时间最优轨迹具有bang-bang的约束结构. 基于控制向量参数化方法, 问题被转化为具有无穷维约束的半无穷规划问题. 通过构造拉格朗日函数, 约束优化问题转化为一系列无约束问题. 由于问题凸性, 故迭代求解采用高效的线搜索Newton-CG方法. 通过求解给定测试路径的时间最优轨迹规划问题, 验证了所提方法的有效性.  相似文献   

12.
拉格朗日函数的鞍点符合非线性规划的K-T条件,是一种特殊的逗留点,当满足凸性条件时,又是全局最优解.在梯度法最优潮流的求解过程中,确定不等式约束的拉格朗日乘子以及求取最优步长等比较困难,文中在采取一定假设的基础上,运用鞍点迭代算法进行上述问题的求解.最后将该方法应用于IEEE-30节点系统,验证了它的有效性.  相似文献   

13.
分数阶扩散方程约束的分布式最优控制问题广泛地应用于科学和工程领域,包括优化设计、控制和参数识别;针对这类问题,提出了一种高阶的快速算法。对于求解该问题的一阶最优条件所产生的耦合两点边值问题,在空间上利用紧差分,时间上利用边值方法对该问题进行离散,离散后得到一个2×2块线性系统;然后使用带有Kronecker积分裂的迭代算法求解该线性系统,该算法是块状的Kronecker积结构,通过交替的Kronecker积分裂迭代方法得到了这个Kronecker积,并证明了该分裂迭代算法是收敛的;同时使用GMRES方法来加速Kronecker积分裂迭代的收敛;最后数值实验表明了该算法的精确性和计算效率。  相似文献   

14.
According to the Wide Area Network model, we formulate Internet flow control as a constrained convex programming problem, where the objective is to maximize the total utility of all sources over their transmission rates. Based on this formulation, flow control can be converted to a normal unconstrained optimization problem through the barrier function method, so that it can be solved by means of a gradient projection algorithm with properly rate iterations. We prove that the algorithm converges to the global optimal point, which is also a stable proportional fair rate allocation point, provided that the step size is properly chosen. The main difficulty facing the realization of iteration algorithm is the distributed computation of congestion measure. Fortunately, Explicit Congestion Notification (ECN) is likely to be used to improve the performance of TCP in the near future. By using ECN, it is possible to realize the iteration algorithm in IP networks. Our algorithm is divided into two parts, algorithms in the router and in the source. The router marks the ECN bit with a probability that varies as its buffer occupancy varies, so that the congestion measure of links can be communicated to the source when the marked ECN bits are reflected back from its destination. Source rates are then updated by all sessions according to the received congestion measure. The main advantage of our scheme is its fast convergence ability and robustness; it can also provide the network with zero packet loss by properly choosing the queue threshold and provide differentiated service to users by applying different utility functions.  相似文献   

15.
用变换的思想,构造一个Meyer问题序列去逼近时间最优控制,从而证明时间最优控制的存在性。这不仅给出时间最优控制存在性的新证明,同时为时间最优控制的计算提供了一个新途径,并揭示了时间最优控制问题和Meyer问题的深刻关系。  相似文献   

16.
利用经典线性二次最优控制的Riccati方程的线性迭代法研究一类奇异线性二次最优控制问题.对于线性迭代序列的收敛性进行了分析并且给出了算法.该算法通过3个例子得到验证.  相似文献   

17.
研究Hilbert空间中一类随机系统的最优控制问题。先给出实值平方可积鞅按取值于Hilbert空间的Brown运动的随机积分的表示,然后证明了最优控制主要条件的一个鞅结果,并用可测选择法给出最优控制的一个具体形式。  相似文献   

18.
一种边缘保护的灰度图像插值算法   总被引:2,自引:0,他引:2  
提出一种边缘保护的灰度图像插值算法,目的在于从低分辨率图像中复原出高分辨率的图像。首先对低分辨率图像做双线性插值放大,然后用一个二维非线性滤波器做迭代滤波处理,从而得到高质量的插值放大图像。实验仿真结果表明,该算法在插值放大图像的边缘保护方面取得了良好的效果。  相似文献   

19.
研究了非线性离散系统最优控制问题,提出一种逐次逼近方法;首先将系统的最优控制问题转化为非线性两点边值问题族,然后通过构造线性两点边值问题族,将非线性两点边值问题转化为非奇次线性两点边值问题族;得到的最优控制律由精确控制项和非线性补偿项两部分组成,精确控制项可以通过求解R iccati方程求出其精确解,非线性补偿项由逐次逼近法求解一族线性伴随向量方程的解序列求得;仿真结果证明了逐次逼近方法的有效性。  相似文献   

20.
基于3维模型的月球表面软着陆燃耗最优制导方法   总被引:1,自引:0,他引:1  
为了解决月球探测器软着陆燃耗最优制导问题,基于变分法设计了最优制导律.首先,基于变分法,将问题转换为终端时间自由且带有条件约束的两点边值问题;其次,引入了时间尺度变换方法,将终端时间自由的两点边值转换成终点时间固定的两点边值问题;最后,为了确保两点边值的求解迭代算法收敛,提出了一种终端时间和共轭变量初始值猜测方法,并通过数值方法取得终端时间和共轭变量精确的初始值以及着陆过程中最优制导律和3维最优轨迹.仿真实验结果表明,所提方法有效,算法可收敛,并且实现了燃耗最优制导.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号