首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 953 毫秒
1.
针对传统目标跟踪算法过分依赖环境模型的问题,提出了一种基于分布式纳什Q学习的多传感器协同目标跟踪算法.分析了强化学习与分布式纳什Q学习算法的原理;描述了多传感器的协同跟踪态势,建立了离散系统的非线性模型,给出了传统的扩展卡尔曼滤波解决方法;定义了对分布式纳什Q学习性能影响至关重要的传感器行为和奖惩函数,奖惩函数通过计算预测误差方差阵的迹得到;采用基于贝叶斯推理的概率统计方法解决了Q函数的更新问题.纯方位量测信息的被动跟踪仿真结果表明,相比于传统滤波算法,该算法增强了传感器对环境变化的适应性,实现了对目标的有效跟踪,提高了跟踪精度.  相似文献   

2.
为了研究非线性测量误差模型强影响点的识别问题,首先将非线性测量误差模型中存在误差的不可观测的数据当作缺失数据,利用SA-MCMC算法求得模型参数的最大似然估计,然后用Q函数代替可观测数据的对数似然函数进行影响分析,得到了建立在Q函数基础上的广义Cook距离及其一步近似,最后通过算例说明了诊断统计量的有效性.  相似文献   

3.
利用回归树算法作为一种函数近似方法,发挥回归树在进行数值预测上的准确性及快速性,将Q学习和回归树算法组合在一起,改善单纯Q学习所需要的培训时间过长的缺点·详细分析了实际市场模型中使用基于回归树的Q学习算法来确定商品销售价格的策略·最后利用数值分析方法来说明此算法在实际应用中所获得的平均利润和培训时间两个参数的关系,并给出它们的关系曲线图·  相似文献   

4.
首先将问题(P)转化为其等价问题(Q),然后利用线性化技术,给出(Q)目标函数及约束函数的线性下界函数,建立了(Q)松弛线性规划问题(RLP),通过求解其子域上一系列线性规划问题,不断更新(Q)的上下界,理论上证明了算法的收敛性,数值实验表明了算法的可行性.  相似文献   

5.
给出了函数逼近问题,提出了一种新的神经网络模型,结合函数逼近问题及该神经网络模型给出了一种学习算法,并利用该算法对函数逼近进行了仿真.说明了该算法的实用性.  相似文献   

6.
基于EM算法和Laplace逼近,首先给出了R-L模型的参数估计,然后应用完全数据对数似然函数的条件期望以及相应的Q距离函数,对R-L模型数据进行了数据删除影响分析和局部影响分析,并通过实际数据验证了所得诊断统计量的有效性.  相似文献   

7.
针对不确定条件下的伙伴选择决策问题,引入基于ANFIS和神经网络的模糊神经网络,实现了一种全新的进行值函数逼近的梯度下降Q学习的算法,对多影响因素进行FNN学习,将输出量作为标准Markov博弈模型的输入量,得到影响的策略,最后研究了一个应用实例,利用具体历史数据对建模方法和模型进行了验证和分析。  相似文献   

8.
深度Q神经网络算法的值函数迭代算法大多为Q学习算法,这种算法使用贪婪值函数作逼近目标,不利于深度Q神经网络算法获得长期来看更好的策略。通过以期望思想求解的期望值函数取代贪婪值函数作为更新目标,提出了基于期望值函数的离策略深度Q神经网络算法,并结合DQN算法神经网络更新方法,给出期望值函数能够作用于DQN算法的解释。通过使用该算法能够快速获得长期回报较高的动作和稳定的策略。最后分别在CarPole-v1和Acrobot仿真环境中对期望值函数的离策略深度Q神经网络算法和深度Q神经网络算法进行获取策略的稳定性对比实验,结果表明,基于期望值函数的离策略深度Q神经网络算法能够快速获得长期回报较高的动作,并且该算法表现更为稳定。  相似文献   

9.
提出一种基于Pareto多目标遗传算法生成一组精确性和解释性较好折衷模糊系统的方法.该方法采用模糊聚类算法辨识初始的模糊模型,利用匹茨堡型实数编码的遗传算法对初始模糊模型的结构和参数进行优化,基于NSGA-Ⅱ算法的目标函数同时考虑模型的精确性和解释性;最后,在算法中利用基于相似性的模型简化方法约简模糊系统.利用该方法对两个Benchmark系统进行建模,仿真结果验证了该方法的有效性.  相似文献   

10.
给出半参数非线性回归模型的t-型估计及其EM算法,同时获得估计的相合性及渐近正态性.并基于EM算法中的Q函数,研究了半参数非线性回归模型的统计诊断方法.最后,用一个模拟例子和一个实际例子验证了本文提出的t-型估计和诊断方法的有效性.  相似文献   

11.
研究了关于纵向数据的线性混合模型,由Fisher得分迭代法获得数据的删除模型(CDM)和均值漂移模型(MSOM)中回归参数β的M估计(稳健估计)的等价性,并对基于两种模型得到的诊断统计量进行了葡萄糖数据的实例分析,说明了方法的有效性.  相似文献   

12.
Crowder曾经研究过一组种子数据,这组数据所对应的模型为二项线性混合效应模型.本文运用EM算法对模型进行参数估计,并利用“点删除”方法探测到了数据中的强影响点.  相似文献   

13.
混合效应模型是分析纵向数据的有效方法,但模型的线性结构限制了其适应现实数据的能力。提出了一种RE-BET算法及其变形的RE-BEBT算法,采用树形方法估计混合效应模型的固定效应,可以自动选择重要变量,能更好地发现和描述变量间关系;采用基于Dirichlet过程先验的贝叶斯方法估计混合效应模型的随机效应,使模型可以适用于小样本数据。以低合金钢和碳钢的海水腐蚀数据为例,通过与实验数据和其他算法的计算结果对比分析,验证了RE-BET算法可行性和有效性。  相似文献   

14.
The degradation process modeling is one of research hotspots of prognostic and health management(PHM),which can be used to estimate system reliability and remaining useful life(RUL).In order to study system degradation process,cumulative damage model is used for degradation modeling.Assuming that damage increment is Gamma distribution,shock counting subjects to a homogeneous Poisson process(HPP)when degradation process is linear,and shock counting is a non-homogeneous Poisson process(NHPP)when degradation process is nonlinear.A two-stage degradation system is considered in this paper,for which the degradation process is linear in the first stage and the degradation process is nonlinear in the second stage.A nonlinear modeling method for considered system is put forward,and reliability model and remaining useful life model are established.A case study is given to validate the veracities of established models.  相似文献   

15.
考虑一类带有一般线性约束条件的零一膨胀Poisson回归模型, 给出参数估计的EM(expectation maximization)算法, 并利用数值模拟和实际数据分析验证了结果的灵活性和可行性.  相似文献   

16.
考虑一类带有一般线性约束条件的零一膨胀Poisson回归模型, 给出参数估计的EM(expectation maximization)算法, 并利用数值模拟和实际数据分析验证了结果的灵活性和可行性.  相似文献   

17.
随着随机模型的广泛应用,关于随机效应模型的参数估计一直是线性模型的最活跃的研究方向之一。我们经常估计这类模型的固定效应和方差成分。我们使用极大似然估计作为估计方差成分的一种技巧,为了考虑到估计固定效应时的自由度的损失,我们又会使用限制极大似然估计。计算方差成分的ML或者REML估计时,有很多迭代算法可以使用。我们关心的是Fisher得分法和EM算法应用到随机效应模型的方差成分上,通过使用这两种算法对随机效应模型的方差成分的极大似然估计和限制极大似然估计进行比较分析。本文给出EM算法用于求极大似然估计的具体公式补充证明,并对Fisher得分法在随机效应模型中的应用限制极大似然估计给予具体公式。  相似文献   

18.
当回归模型误差服从非对称或非正态分布时,尤其是在重尾分布或分布受污染的情况下,如何检测纵向数据中的异常值是数据分析中的一个重要问题。为了克服非正态分布模型误差的影响,采用稳健的分位数方法对一类线性混合效应模型进行参数估计,并分别基于数据删除模型和均值漂移模型构造强影响点的诊断度量和异常值的检验统计量,以有效地检测强影响点和异常值点。在识别强影响点时,为了减轻计算负担,利用光滑逼近的方法给出了数据删除模型参数的一步近似估计,并据此构造出基于损失函数的距离和Cook距离。为了能够识别异常值点,首先构造出检验异常值点的Wald统计量,然后基于数据删除模型和均值漂移模型的系数估计的等价性,利用Bootstrap抽样得到检验的拒绝域。数值模拟结果表明,本文所提的诊断度量和检验统计量都能够很好地判断出强影响点和异常值点。最后应用本文方法针对化学实验纵向数据进行了影响分析。  相似文献   

19.
针对2种流体的Alleh-Cahn型相场模型提出了一种自适应移动网格方法.移动网格方法包括网格重分布和偏微分方程求解2个相对独立的部分.通过求解一个类似于Poisson方程的偏微分方程组获得网格重分布,大量的网格点聚集在2种流体的界面附近从而提高了分辨率,而在其他的区域则仅有比较稀疏的网格点.Allen-Cahn模型用...  相似文献   

20.
研究了一类双险种风险模型,模型中的索赔到达计数过程和其中一个险种的保单到达计数过程均为Cox过程,得到了最终破产概率满足的推广的Lundberg不等式;研究了混合Poisson风险模型的破产概率,得出在一定条件下平稳Cox模型比Poisson模型风险更大的结论.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号