首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
回顾了基于回报函数逼近的学徒学习的发展历史,介绍了目前的主要工作,总结了学徒学习的一般方法,讨论了线性和非线性假设条件下的回报函数求解,比较了逆向增强学习(IRL)和边际最大化(MMP)两类逼近方法.基于IRL的学徒学习是一种通过迭代的方法用基回报函数的线性组合来逼近真实回报函数的过程.MMP方法可以看作是一类基于梯度下降的最优化方法.综合采用滤波及将策略函数概率化等方法可以降低对专家演示的最优要求.最后指出了该领域存在的问题,提出了未来的研究方向,如在部分可观察马尔可夫决策过程框架下的学徒学习及对不确定策略的学习等.  相似文献   

2.
在网络大数据和移动互联网时代,函数逼近广泛应用于各行各业中,深度学习和自动编码器也得到了越来越多的关注.在大数据集环境下,由于网络层数有限,以及系统参数难调优,传统有监督学习的BP神经网络算法易出现过拟合收敛到局部最优的问题;在应用于逼近控制系统时易出现效率低、误差大等不良效果.针对以上问题,提出一种基于Deep Learning自编码的逼近控制系统,采用逐层参数独立学习机制.通过对比仿真实验表明,无监督特征学习的深度学习自编码能有效提高逼近系统函数逼近的准确率,在逼近控制系统中具有良好的应用前景.  相似文献   

3.
给出了函数逼近问题,提出了一种新的神经网络模型,结合函数逼近问题及该神经网络模型给出了一种学习算法,并利用该算法对函数逼近进行了仿真.说明了该算法的实用性.  相似文献   

4.
本文给出了L_p(1≤p<+∞)范数下凸集约束逼近的一个特征定理。作为它的应用,我们在很弱的条件下对约束s阶(s≥0)导数值域逼近(包括导数插值约束逼近、单边逼近、单调逼近、共正逼近及共单调逼近等特例),局部凸锥形子集的逼近(包括约束系数逼近和系数有界限的逼近等)以及多重约束下的逼近给出了更为具体和便于应用的特征。  相似文献   

5.
移动最小二乘(MLS)法是数据插值、数值分析和统计等学科领域的一种逼近方法.H.Y.Wang,D.H.Xiang,D.X.Zhou(J Approx Theory,2010,162:599-614.)用MLS方法研究了L2框架下学习理论中的回归问题,从而得到了样本误差、逼近误差的更优结果.但是很多函数类在L2框架下很难研究,于是本文用移动最小p乘(MLP)法将L2框架下学习理论中回归问题的一些理论推广到Lp(1≤p≤∞)框架下,从而为研究Lp框架下学习算法的泛化性能提供了理论基础.  相似文献   

6.
针对复杂再励学习系统状态空间存在维数灾问题,结合多移动机器人协调避障路径规划实际应用,用非均匀模糊分割方法将状态空间分解成模糊子空间,相应地将小脑模型连接控制器网络(Cerebellar Model Articulation Controller,CMAC)函数逼近器改进为模糊CMAC(Fuzzy CMAC,FCMAC)函数逼近器,并将FCMAC函数逼近器置入滞后更新多步Q(Pstphoned-Updating Multi-Stp Q-learning,PUMSQ)学习笮算法,提出FCMAC-PUMSQ学习算法,仿真实验证明,该算法有效且有较好的鲁棒性,FCMAC函数逼近器有较好的收敛速度和泛化能力。  相似文献   

7.
用一种改进的BP小波神经网络对脑电图(EEG)数据信号进行压缩.对小波神经网络采用最速梯度下降法优化网络参数,并对学习率采用自适应学习速率方法自动调节.利用小波神经网络的函数逼近特性,对脑电随机信号进行逼近,最终压缩比可达15以上.实验结果显示,小波神经网络在大量压缩数据的同时,能较好地恢复原有信号。  相似文献   

8.
基于RBFNN的强化学习在机器人导航中的应用   总被引:3,自引:0,他引:3  
在复杂连续环境下,强化学习系统的状态空间面临维数灾难问题,需要采取量化的方法,降低输入空间的复杂度。径向基神经网络(RBFNN:Radial Basis Function Neural Networks)具有较强的函数逼近能力及泛化能力,由此提出了基于径向基神经网络的Q学习方法,并将其应用于单机器人的自主导航。在基于径向基神经网络的强化学习系统中,用径向基神经网络逼近状态空间和Q函数,使学习系统具有良好的泛化能力。仿真结果表明,该导航方法具有较强的避碰能力,提高了机器人对环境的适应能力。  相似文献   

9.
一种新的联想记忆系统的学习收敛性(Ⅱ)   总被引:1,自引:0,他引:1  
基于牛顿向前插公式的新的高阶联想记忆系统 (NFI AMS) ,可以用来实现任意阶多变量多项式函数的无误差逼近 ,证明了对于任意多变量连续函数均可通过一组与子区域个数相同的学习数据 ,NFI AMS的学习总是以任意精度收敛的。  相似文献   

10.
利用Chebyshev正交多项式展开的方法,考虑了带奇点的解析函数f-(x)=1(x-a)/2以及g(x)=ln(1+x)的逼近问题,得到了指数型收敛速度.同时,研究了f(x)=1/x-a的最佳逼近多项式的导数对f′(x)的逼近,并给出了其快速收敛阶.结果表明,基于Chebyshev多项式展开的逼近对一些函数有很好的逼近效果.  相似文献   

11.
内隐学习的研究关系到人类潜能开发的根本问题,是认知心理学研究的热点和难点.传统人工神经网络能够成功地模拟内隐学习,但模拟过程存在许多弊端,模拟效率也非常低.针对这些问题,采用形态学联想记忆网络(MAM)去解决.MAM不仅能够实现内隐学习的模拟,而且可以克服传统人工神经网络在模拟内隐学习时的各种缺陷,实验表明了该方法的有效性.  相似文献   

12.
基于Lie群的机器学习理论框架   总被引:5,自引:0,他引:5  
借用具有良好数学结构的Lie群来研究机器学习,提出了基于Lie群的机器学习(ML)基本概念、对偶空间学习概念等,形成了基于Lie群的学习理论框架.该理论框架可以用代数和几何的方法来描述机器学习系统,弥补了原有机器学习理论的不足.  相似文献   

13.
在心理咨询的学生来访者中,学习障碍是一种非常普通的问题。一些学习障碍的背后隐藏的是情绪问题,这些可能来自于生活的方方面面。因此,解决这类学习障碍从问题解决入手,会取得良好的效果。通过对一个学习障碍个案的三次咨询,系统介绍了问题解决疗法的过程与效果。  相似文献   

14.
提出了粒子群算法的一种新的个性因子,以改进其求解组合优化问题的效果.个性因子是基于对社会心理学的观察而对每个粒子增加的一个新属性,使每个个体具有不相等的社会因子和认知因子,但整个种群具有几乎相等的社会和认知学习能力,并符合高斯分布,从而增强了粒子的搜索和开发能力,加速了收敛.最后,使用二分子图问题和旅行商问题验证了个性因子的效果,大量的随机仿真实验结果说明该因子效果较好.此外,还分析并解决了二分子图问题的解空间对称性问题.  相似文献   

15.
物理难学是一个普遍性的问题,要从根本上改变这种现状,就要让学生拥有一定的学习策略。学习策略在于强调学生的自主学习,强调学生对学习过程的反思和调控。物理学习策略应包括物理现象的学习策略、物理概念和规律的学习策略以及物理问题解决的学习策略三个方面。学生的物理学习策略,需要在教师的指导和训练中逐步形成。  相似文献   

16.
With the complexity of the composition process and the rapid growth of candidate services,realizing optimal or near-optimal service composition is an urgent problem.Currently,the static service composition chain is rigid and cannot be easily adapted to the dynamic Web environment.To address these challenges,the geographic information service composition(GISC) problem as a sequential decision-making task is modeled.In addition,the Markov decision process(MDP),as a universal model for the planning problem of agents,is used to describe the GISC problem.Then,to achieve self-adaptivity and optimization in a dynamic environment,a novel approach that integrates Monte Carlo tree search(MCTS) and a temporal-difference(TD) learning algorithm is proposed.The concrete services of abstract services are determined with optimal policies and adaptive capability at runtime,based on the environment and the status of component services.The simulation experiment is performed to demonstrate the effectiveness and efficiency through learning quality and performance.  相似文献   

17.
前向网络的两种混合学习策略   总被引:10,自引:0,他引:10  
针对前向网络反向传播算法(BP)训练缓慢和易于陷入局部极小的缺点以及反向运算的复杂性,利用BP算法监督学习特点、模拟退火(SA)算法在局部极小处的概率突跳特性和遗传算法(GA)的并行化群体搜索的特点,有效结合BP和SA算法以及GA和SA算法,提出了前向网络的两种混合学习策略即BP&SA混合策略和GA&SA混合策略。以异或问题为例,通过计算机仿真对混合策略与BP、改进BP算法的比较表明混合学习策略较大程度改进了前向网络学习的收敛性能和收敛速度,并一定程度上避免了反向运算的复杂性,是前向神经网络学习的有效算法。  相似文献   

18.
The Extreme Learning Machine(ELM) and its variants are effective in many machine learning applications such as Imbalanced Learning(IL) or Big Data(BD) learning. However, they are unable to solve both imbalanced and large-volume data learning problems. This study addresses the IL problem in BD applications. The Distributed and Weighted ELM(DW-ELM) algorithm is proposed, which is based on the Map Reduce framework. To confirm the feasibility of parallel computation, first, the fact that matrix multiplication operators are decomposable is illustrated.Then, to further improve the computational efficiency, an Improved DW-ELM algorithm(IDW-ELM) is developed using only one Map Reduce job. The successful operations of the proposed DW-ELM and IDW-ELM algorithms are finally validated through experiments.  相似文献   

19.
最优潮流问题是电力系统中一个重要的问题,从数学角度上讲,它是一个非线性规划问题。提出了一种基于学习策略的遗传算法用于解决最优潮流问题。学习策略使得种群中的普通个体可以向优良个体学习其优秀的基因结构,从而提高了个体的适应度,加快了算法的寻优速度,增强了算法的搜索能力。该算法中还采用排挤策略来避免个体的过度拥挤,增强了算法的全局搜索能力。通过算例验证了算法的可行性和有效性。  相似文献   

20.
针对非支配排序遗传算法 (NSGA-II, non-dominated sorting genetic algorithm II)在求解柔性作业车间多目标优化调度问题中多样性不足、易于早熟与局部收敛的缺点,提出一种基于强化学习的改进NSGA-II算法(RLNSGA-II, reinforcement learning non-dominated sorting genetic algorithm II)。为避免NSGA-II陷入局部收敛问题引入双种群进化策略,利用性别判定法将种群拆分为两个种群,并在进化过程中采用不同的交叉变异算子,增加算法的局部和全局搜索能力;为解决NSGA-II精英策略造成多样性不足的问题,融合多个多样性度量指标,利用强化学习动态优化种群迭代过程中的拆分比例参数以保持多样性,改善算法收敛性能。最后通过Kacem标准算例进行了仿真实验与性能分析,验证了RLNSGA-II的有效性与优越性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号