首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
对非周期不可约Markov链上的线性函数近似平均报酬指标即时差分学习方法进行了研究.近似器由权值进行增量更新的固定特征函数线性加权组合构成,在对已有的算法进行比较分析的基础上,利用线性参数估计理论的有关成果,提出了基于值函数线性近似表示的平均报酬指标多步递推最小二乘即时差分强化学习算法.并给出了其一致收敛性证明.  相似文献   

2.
3.
一种基于最小二乘准则的自适应滤波算法   总被引:7,自引:0,他引:7  
基于最小二乘准则J(n)=∑i=1^nλn-i|e(i)|^2,利用最徒梯度下降法,得到一种新的梯度型自适应滤波算法,该算法避免了递推最小二乘RLS(Recursive Least Squares)乍江需递推估计更新自相关矩阵Rxx(n)的逆的不足,计算模拟仿真结果表明该算法有良好的收敛性能,收敛速度快于LMS(Least Mean Squares)算法、NLMS(Normalized Least Mean Squares)算法和RLS算法。  相似文献   

4.
本文给出了求解具有线性不等式约束的线性模型参数的最小二乘估计的一个方法,并得到了这个估计的一般表达式。  相似文献   

5.
传统的最小二乘估计在处理一般线性回归模型的参数β和σ2的估计问题时,若遇到异常数据模型拟和得往往不好,现提出另一种估计方法:修正的最小二乘估计.结果表明此方法在处理异常数据时具有明显的优越性.  相似文献   

6.
针对杂交边界点法中采用移动最小二乘近似时存在的计算量大,易形成病态矩阵的问题,将改进移动最小二乘近似和修正变分原理相结合,提出了基于改进移动最小二乘近似的杂交边界点法.这种方法保留了杂交边界点法的纯无网格法特性,域内未知场函数的计算无需再次沿边界积分等优点,而且不会出现病态方程组,数值计算稳定,计算精度高.数值算例验证了该方法的有效性.  相似文献   

7.
对线性回归模型中的一类线性估计,在均方误差矩阵准则和PC准则下,研究了它相对于广义最小二乘估计的优良性.当设计阵为非列满秩时,讨论了回归系数的可估函数的优良性.  相似文献   

8.
将线性受限条件运用于最小二乘,提出了一种线性受限最小二乘恒模波束形成算法,称为LC-LSCMA,并将它与传统的最小二乘恒模波束形成算法(LSCMA)及预解扩最小二乘恒模波束形成算法(P-LSCMA)进行了仿真比较。仿真结果表明,提出的LC-LSCMA算法比LSCMA及P-LSCMA的信干比性能和误码率性能要好,特别在低信噪比情况下性能仍优于LSCMA。  相似文献   

9.
最小二乘法的参数估计方法虽然体现了拟合结果的整体优化特征,却没有体现出各参数估计量的自身统计特征,对此本文给出一种新的参数估计方法,同最小二乘法相比,该方法得到的参数估计值受统计数据的影响最小,文中还讨论了参数估计值自身具有的线性和无偏性。  相似文献   

10.
考虑一类多总体线性回归模型,其特点是它们均具有部分相同回归系数.采用各个子总体内样本利用最小二乘方法估计回归参数,然后依据样本容量进行加权估计公共回归系数,最后把公共回归系数回代到各个线性回归模型,利用最小二乘方法估计不同部分系数.理论结果表明,此种方法得到的估计量,不仅是无偏估计,而且方差比用单个子总体样本得到的最小...  相似文献   

11.
一种在线自适应控制马氏链的强化学习算法   总被引:2,自引:2,他引:0  
讨论平均准则控制马氏链的强化学习算法。目的是寻找使得长期每阶段期望平均报酬最大的最优控制策略,由于事先未知状态转移矩阵及报酬向量,故必需使用自适应控制方法,通过引入称之为行动器和评判器的神经网络构造,使得学习单元在不断学习中,最终能发现最优策略。行动器的参数在学习中不断被修正,每一时刻的参数的值均对应着一个随机控制策略。评判器用来估计这些参数以找出最优控制策略。  相似文献   

12.
用更为紧凑的方法表示和存贮值函数,以求解大规模平均模型Markov决策规划(MDP)问题。通过状态集结相对值迭代算法逼近值函数,用Span半范数和压缩映原理分析算法的收敛性。给出了状态集结后的Bellman最优方程。在Span压缩条件下了该算法的收敛性,同时还给出了其误差估计。  相似文献   

13.
直接数字频率合成技术在数字通信系统中被广泛采用..但是DDS本身的结构决定了其输出信号中存在无法消除的杂波,采用严格的数学方法分析了基于分段线性近似DDS中的频谱。得到DDS输出信号的时域和频域数学表达式,为精确计算DDS的杂散抑制度提供了方便。并作出八分段近似DDS的误差分析和频谱图。  相似文献   

14.
本文研究了误差为鞅差序列下的异方差部分线性回归模型.基于非参数估计量,我们导出了最小二乘法和加权最小二乘法的参数估计量,并且在适当条件下得到了它们的矩相合性.同时,通过模拟研究了有限样本下估计量的性能.  相似文献   

15.
针对强化学习算法的状态值泛化和随机探索策略在确定性MDP系统控制中存在着学习效率低的问题,本文提出基于模型的层次化强化学习算法.该算法采用两层结构,底层利用系统模型,采用贪婪策略选择探索动作,完成强化学习任务.而高层通过对状态区域的分析,指导底层的学习,纠正底层错误的动作.高层对底层的学习的指导作用主要包括:在泛化过程中,对泛化区域中正确与错误的状态判断值分别采用不同的学习因子,减小泛化对算法收敛性的影响;建立状态区域的推理规则,用规则指导未知状态区域的学习,加快学习速度;利用系统模型和推理规则,将探索过程集中于系统的可控区域,克服采用随机探索策略需要系统全状态空间内搜索的问题.本文提出的算法能在较短的时间内实现系统的初步控制,其有效性在二级倒立摆的控制中得到验证.  相似文献   

16.
文章讨论了线性流形上反次对称矩阵的最小二乘解,得到了解的一般表达式,对于任意给定的实矩阵,在最小二乘解集中得到了的最佳逼近解.  相似文献   

17.
应用Tadmor的关于双曲型守恒方程式差分逼近的收敛性判别法,对于若干差分逼近式,引入一些参数,只要在上机时适当调整此参数值,即可得到其收敛性。此外还首先提出关于判别分辨率高低的度量方法概念。  相似文献   

18.
现代数字信号(包括图像)的处理是基于原始信号f(x)的一组局部平均离散采样值.这种局部平均采样可以有效地抑制高频噪声的影响.由二项过程、泊松过程和负二项过程导出的局部平均概率型算子是在采样点处的一种局部积分平均.为此,研究了这种算子线性组合的点态逼近,得到了误差的阶和新的Ditzian光滑模之间的等价关系.  相似文献   

19.
讨论了线性流形上广义反次对称矩阵的最小二乘解,得到了解的一般表达式,对于任意给定的实矩阵A,在最小二乘解集中得到了A的最佳逼近解.  相似文献   

20.
针对强遮挡导致的跟踪目标失效问题, 提出一种基于字典学习改进的时空上下文算法. 先在目标和上下文区域构建前景字典和上下文字典, 再利用稀疏解的特性, 给提取目标特征更高的权重, 并参与模板的更新, 构造新的条件概率. 实验结果表明, 在出现严重遮挡的数据集中, 时空上下文算法跟踪成功率为19.5%, 改进算法成功率达94.5%, 改进算法能在出现强遮挡情况下有效对抗遮挡问题, 稳定跟踪.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号