共查询到20条相似文献,搜索用时 15 毫秒
1.
本文考虑的是状态空间和行动空间均为一般集的非平稳MDP平均模型εn-最优策略的结构和性质,通过相应的一般决策模型的建立及εn-最优行动集Aεn的引入,讨论了εn-最优策略的凸组合,凸分解等若干性质。 相似文献
2.
3.
郭先平 《湖南师范大学自然科学学报》1996,19(1):21-24
考虑的是任意状态空间,任意行动空间MDP平均模型的四个平均准则,在O.H.Lerma的遍历性条件下,利用稳定性定理和可测选择理论简明地证明了存在平稳策略关于此模型的四个平均准则同时是最优的,从而扩充并加强了O.H.Lerma(1989)的主要结果。 相似文献
4.
研究平稳静态河道水波模型的最优控制问题.应用分布式参数系统最优控制理论和相关的泛函Sobolve空间知识,选择轨迹型的性能指标和特殊的Banach空间,证明平稳模型方程在Dirichlet边界条件下最优解的存在性.通过引入Lagrangian乘子将等式约束和轨迹型性能指标转化为Lagrangian项和罚函数项,并用非线性泛函中的Frechet导数和变分不等式研究了最优解存在的一阶必要和二阶充分最优条件.此条件是研究浅水波模型最优控制可计算性理论和实际应用的基础. 相似文献
5.
6.
《湖南师范大学自然科学学报》2017,(5)
历史相依决策模型(HDDM)及历史相依决策过程(HDDP)是决策模型及相应的决策过程的一般情形.马氏决策模型(MDM)及马氏决策过程(MDP)是HDDM及HDDP的特殊情形.本文严格地建立了历史相依决策模型,并证明了相应的历史相依决策过程的存在性,证明是构造性的.作为HDDM及HDDP的特殊情形,建立了马氏决策模型(MDM),并构造了相应的马氏决策过程(MDP). 相似文献
7.
针对人民币对美元汇率问题,以2015-01-05—2017-12-20这段时间内的人民币对美元汇率为样本数据,建立了合理的ARIMA模型.结合自相关、偏相关系数图以及单位根检验判断原序列是非平稳时间序列,一阶差分后的序列是平稳时间序列.结合SIC等指标选择出最优的ARIMA(1,1,2)模型.运用该模型进行汇率预测,为企业和投资者的决策提供了可靠的依据. 相似文献
8.
研究了二维(2-D)系统的非脆H∞控制.研究的对象线性离散2-D系统是由2-D状态空间Roessor模型描述的.所设计的状态反馈控制器的状态反馈增益带有范数有界的不确定性.当状态反馈增益的不确定性为加性不确定性时,该控制器使得所得到的闭环系统对于此类不确定性基于线性矩阵不等式方法是非脆稳定的.而H∞性能始终小于指定的数γ. 相似文献
9.
研究了二维(2-D)系统的非脆控制.研究的对象线性离散2-D系统是由2-D状态空间Roessor模型描述的.所设计的状态反馈控制器的状态反馈增益带有范数有界的不确定性.当状态反馈增益的不确定性为加性不确定性时,该控制器使得所得到的闭环系统对于此类不确定性基于线性矩阵不等式方法是非脆稳定的.而D性能始终小于指定的数Y. 相似文献
10.
船舶辐射噪声的非平稳ARMA模型的建立 总被引:2,自引:0,他引:2
分析了船舶辐射噪声信号的特点,提出了一种简单、新颖的适用于船舶辐射噪声的非平稳ARMA模型.对海上实录的三大类船舶辐射噪声建立ARMA模型的实验结果表明该非平稳模型不仅具有较简单的形式,而且具有较高的精度. 相似文献
11.
针对非平稳非线性时间序列的数据挖掘与预测问题,提出一种基于分层有限状态机的预测方法 .首先,将时间序列构建成有限状态机(FSM)模型,将时间序列的相对序列模式作为状态.然后,构建一种层次模型,通过关联特定模式形成中间状态,并以递归方式对模式进行分组,以此解决长序列造成的过度训练问题.最后,通过梯度下降法结合所有有限状态(FS)预测器的输出,生成最终预测结果 .实验结果表明,该方法能够对时间序列进行有效的规则挖掘,具有较高的预测精度. 相似文献
12.
13.
以资源型收缩城市鸡西市为例,通过构建带有非期望产出的SBMUndesirable模型对其空间效率进行度量,通过模糊综合评判法构建民生质量脆弱性模型,采用耦合协调模型对两者间的耦合协调度进行评价,结果表明:鸡西市城市空间的损失主要是投入无效率和非期望产出无效率,投入产出无效率多低于非期望产出无效率;鸡西市民生质量呈现先升后降趋势,矿工安全问题是影响民生质量的关键因素;鸡西市民生质量脆弱性趋向良性发展.缩小城乡收入差距是其脆弱性得以缓解的主要原因;鸡西空间效率与民生质量的协调度已进入高度耦合时期,但离最优阶段仍有差距,城市建设仍以物质空间建设为主. 相似文献
14.
15.
给出了CAT(O)空间中平均非扩张映射的不动点的存在性定理,进一步证明了其半闭原理,推广了平均非扩张映射的一些已有结论. 相似文献
16.
郭先平 《湖南师范大学自然科学学报》1996,(3)
考虑的是可数状态空间连续时间MDP的折扣模型,与以往不同的是,我们放弃了由策略f所确定的Q(f)-过程唯一的传统假设.而首次考虑Q(f)-过程非唯一的情形,借助于Q-过程的构造理论,用拓扑分析的方法,证明了最优策略的存在性. 相似文献
17.
郭先平 《湖南师范大学自然科学学报》1996,19(3):7-12
考虑的是可数状态空间连续时间MDP的折扣模型,与以往不同的是,我们放弃了由策略f所确定的Q(f)-过程唯一的传统假设。而首次考虑Q(f)-过程非唯一的情形,借助于Q-过程的构造理论,用拓扑分析的方法,证明了最优策略的存在性。 相似文献
18.
本文应用现代控制理论、系统分解与机理建模相结合的方法,对焦化过程进行了模型化研究,建立了焦炉焦化过程温度分布的离散状态空间模型,并进行了仿真研究.并把模型仿真结果与大型焦炉的实测结果进行了对比.该模型具有结构简单、计算量小等优点,适用于计算机实时控制. 相似文献
19.
本文研究了回归函数及其导数的非参数估计.对随机与固定设计的回归函数,分别利用核估计和非参数加权估计,在核函数及权函数满足一条件下,本文证明了估计一致强收敛于待估函数的速度可达到最优.从而进一步推广和发展了Hardle(1988)、Severini,etal.(1992)的许多结果. 相似文献
20.
在移动通信系统中,收发端散射环境变化将导致无线信道呈现非平稳特性,针对基站-移动台之间的三维传播场景,构建了一种非平稳多输入多输出信道模型,该模型考虑了衰落相位的连续性,从而保证输出信道多普勒频率的准确性.提出了一种针对该模型的信道参数更新算法,该算法考虑了传播路径的生灭、时延、功率、出发角和到达角分布等参数随时间变化的演进过程.数值仿真结果表明,所构建的信道模型能够直观地复现无线信道的非平稳特性,输出的各子信道衰落的时变自相关和互相关特性均与理论值吻合,提出的非平稳信道模型的平稳间隔与实测数据相符,可用于三维移动场景下无线通信系统的方案设计、性能优化和系统验证等领域. 相似文献