首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
基于RBFNN的强化学习在机器人导航中的应用   总被引:3,自引:0,他引:3  
在复杂连续环境下,强化学习系统的状态空间面临维数灾难问题,需要采取量化的方法,降低输入空间的复杂度。径向基神经网络(RBFNN:Radial Basis Function Neural Networks)具有较强的函数逼近能力及泛化能力,由此提出了基于径向基神经网络的Q学习方法,并将其应用于单机器人的自主导航。在基于径向基神经网络的强化学习系统中,用径向基神经网络逼近状态空间和Q函数,使学习系统具有良好的泛化能力。仿真结果表明,该导航方法具有较强的避碰能力,提高了机器人对环境的适应能力。  相似文献   

2.
基于神经网络的强化学习在避障中的应用   总被引:5,自引:0,他引:5  
为了提高移动机器人的自学习能力,在基于行为控制结构的基础上设计了智能控制结构,该结构引入了强化学习模块.神经网络具有很好的泛化能力,该文提出了基于神经网络的强化Q学习算法,克服了表格式Q学习算法只能应用到离散的状态中并需要大量存储空间的不足,最后结合智能控制结构应用到移动机器人的避障中.实验结果表明,该方法能够使移动机器人通过自学习实现自主避障.  相似文献   

3.
基于粗糙集-神经网络故障诊断技术的研究   总被引:2,自引:0,他引:2  
提出了一种基于粗糙集-神经网络故障诊断新方法,该方法利用粗糙集理论对数据样本进行数据浓缩,提取初步的映射规则.该规则通过神经网络进行粗映射,利用神经网络的分类逼近能力,建立输入状态空间到输出空间的精确映射,大大提高了神经网络的收敛速度和逼近精度.通过对一个电力电子电路进行实验,实验结果表明,该方法可以有效地减少输入层神经元个数,提高神经网络模型的学习效率和诊断的准确性,在故障诊断中有良好的应用前景.  相似文献   

4.
采用基于行为的控制方法,机器人在不知道外界精确模型的条件下,利用增强式学习自主完成给定的任务,机器人在学习过程中需要对行为状态进行记忆,连接增强式学习利用多层感知器逼近Q函数,泛化状态空间,节约了存储容量,仿真结果证明了这种算法的有效性,解决了基于查表增强式学习不适用连续状态空间的缺陷,为移动机器人进一步实用化提供了依据。  相似文献   

5.
面向复杂问题的BP神经网络并行算法   总被引:1,自引:0,他引:1  
结合基于训练集划分方法与NARA模型,提出了一个BP神经网络的并行算法.该算法不仅提高了BP神经网络的训练速度,而且增强了BP神经网络解决复杂问题的能力.  相似文献   

6.
基于多步回溯Q(λ)学习算法的多目标最优潮流计算   总被引:1,自引:1,他引:1  
为了克服传统的最优化算法面对复杂、非线性描述的多目标最优潮流时无法满足电力系统实时调度运行的这一缺点,提出了一种基于半马尔可夫决策过程的多步Q(λ)学习算法,该算法不依赖于对象模型,将最优潮流问题中的约束、动作和目标转换成算法中的状态、动作与奖励,通过不断的试错、回溯、迭代来动态寻找最优的动作.将该算法在多个IEEE标准算例中与其他算法进行比较,取得了良好的效果,验证了多步Q(λ)学习算法在处理多目标最优潮流问题时的可行性和有效性.  相似文献   

7.
给出了函数逼近问题,提出了一种新的神经网络模型,结合函数逼近问题及该神经网络模型给出了一种学习算法,并利用该算法对函数逼近进行了仿真.说明了该算法的实用性.  相似文献   

8.
基于智能体 (Agent)系统强化学习原理和基于动态规划的Q -学习算法的基础上 ,提出了一种新的Agent强化学习算法 .该算法在Agent学习过程中不断调整Agent知识库的加权值 ,在强化学习的每个阶段 ,通过选取合适的信度分配函数来修正Agent强化学习动作的选取策略 .与标准的Q -学习方法相比 ,具有更加合理的物理结构 ,并且能保证算法收敛 .仿真实验说明该方法加快了标准Q -学习算法的收敛速度 ,具有较好的学习性能  相似文献   

9.
针对柔性作业车间动态调度问题构建以平均延期惩罚、能耗、偏差度为目标的动态调度优化模型,提出一种基于深度Q学习神经网络的量子遗传算法。首先搭建基于动态事件扰动和周期性重调度的学习环境,利用深度Q学习神经网络算法,建立环境■行为评价神经网络模型作为优化模型的适应度函数。然后利用改进的量子遗传算法求解动态调度优化模型。该算法设计了基于工序编码和设备编码的多层编码解码方案;制定了基于适应度的动态调整旋转角策略,提高了种群的收敛速度;结合基于Tent映射的混沌搜索算法,以跳出局部最优解。最后通过测试算例验证了环境-行为评价神经网络模型的鲁棒性和对环境的适应性,以及优化算法的有效性。  相似文献   

10.
为实现模型未知、初始时有脉冲输入的车上单级倒立摆镇定控制,提出了一种采用增强学习规则训练的模糊神经网络控制器。以神经网络构造基于T-S(Tankagi-Sugeno)规则的模糊控制器;用3层前馈网络组成预测器进入仿真,得到倒立摆状态并计算状态预测值,再将状态和状态预测值组成训练数据对,训练状态预测BP(Backward Propagation)网络;利用增强学习的方法训练模糊控制器,根据神经网络产生的模糊控制量和倒立摆状态预测,做出控制决策。此方法简化了模糊控制部分参数调整,亦可应用于其他无模型控制。实验证明,控制器鲁棒性良好,即使在倒立摆参数变化较大时,控制器仍能维持倒立摆平衡。  相似文献   

11.
传统的Q学习已被有效地应用于处理RoboCup中传球策略问题,但是它仅能简单地离散化连续的状态、动作空间。文章提出一种改进的Q学习算法,提出将神经网络应用于Q学习,系统只需学习部分状态—动作的Q值,即可进行Q学习,有效的提高收敛的速度。最后在RoboCup环境中验证这个算法,对传球成功率有所提高。  相似文献   

12.
改进的神经网络快速学习算法   总被引:1,自引:0,他引:1  
提出了一种新颖的神经元模型和用于神经网络训练的推广准则,给出了多层神经网络的快速学习算法,研究了一种用于语音识别的时变多层神经网络及其相应的快速学习算法.语音识别实验表明:所给出的快速学习算法能有效地加速网络训练进程.  相似文献   

13.
针对传统BP神经网络学习过程中学习率选取过大导致振荡的问题, 提出一种新的BP神经网络PID(比例-积分-微分)参数自适应整定算法. 采用BP神经网络对PID参数进行自适应调节和优化, 并利用动量因子优化学习率和增加动量项抑制BP神经网络训练中出现的振荡现象, 以加快收敛速度. 实验结果表明, 该算法有效缓解了振荡现象, 加快了算法的收敛速度.  相似文献   

14.
针对传统BP神经网络学习过程中学习率选取过大导致振荡的问题, 提出一种新的BP神经网络PID(比例-积分-微分)参数自适应整定算法. 采用BP神经网络对PID参数进行自适应调节和优化, 并利用动量因子优化学习率和增加动量项抑制BP神经网络训练中出现的振荡现象, 以加快收敛速度. 实验结果表明, 该算法有效缓解了振荡现象, 加快了算法的收敛速度.  相似文献   

15.
当前非定特人语音识别算法大多只适于连续语音,且识别精度和速度均较低。为此,提出一种新的基于BP神经网络的非特定人语音识别算法,介绍了标准BP神经网络,针对其收敛速度慢的弊端,通过变化的自适应学习速率,令网络训练针对各种阶段自行设置学习速率值,利用变学习速率构建对应的改进BP神经网络模型,将改进的BP神经网络模型看作识别非特定语音的识别器,输入待识别语音,令累计预测残差达到最小,实现非特定人语音识别。将改进模型应用于非特定人语音识别中进行验证,结果表明所提算法识别率更高、识别速度更快,不仅适于连续语音的识别,也适于不连续语音的识别。  相似文献   

16.
针对传统BP神经网络模型收敛速度慢、易陷入局部极小点、网络结构不稳定等缺陷,提出一个小生境遗传算法优化的BP神经网络模型.该模型充分利用小生境遗传算法的搜索能力和BP神经网络的非线性映射和学习联想能力,通过小生境遗传算法的选择、交叉、变异及小生境淘汰等操作,优化BP神经网络的初始权值和阈值,并采用BP算法对网络进行训练,有效解决网络初值不合理的问题,提高网络收敛速度、稳定性.实验证明:与传统方法相比,该模型具有很强的可行性和有效性.  相似文献   

17.
基于进化神经网络的曲面磨削表面粗糙度预测   总被引:4,自引:0,他引:4  
将人工神经网络技术引入曲面磨削加工领域,介绍了利用BP算法建立的曲面磨削表面粗糙度随磨削用量变化的进化神经网络预测模型.针对BP算法存在收敛速度慢、容易陷入局部极小值及全局搜索能力弱等缺陷,采用遗传算法训练BP神经网络,取代了一些传统的学习算法,设计了基于进化神经网络的学习算法.实验和仿真结果表明,基于进化计算的BP神经网络不仅可以克服单纯使用BP网络易陷入局部极小等问题,而且预测精度较高。  相似文献   

18.
为了解决迁移学习中的"负迁移"问题,提出了基于相似度的神经网络多源迁移学习算法。该算法是以经典的BP神经网络模型为基分类器,利用梯度下降法对各个源领域与目标域之间的相似度进行学习和优化,把各个源领域的网络权重参数信息按照与目标域之间的相似程度迁移到目标域中,提高机器学习算法在目标域的分类性能。在UCI数据的Letter-recognition数据集以及20Newsgroups文本数据集上进行实验。实验结果表明了MTL-SNN算法比传统的多源迁移学习算法以及BP神经网络算法在分类准确率上有所提升,因此MTL-SNN算法有效地解决了"负迁移"问题。  相似文献   

19.
混合算法实现的RBF神经网络及在模式辨识中应用   总被引:1,自引:0,他引:1  
把模糊聚类算法和RBF神经网络结合起来,得到一种基于混合算法的RBF神经网络.首先由改进的FCM算法确定神经网络结构;然后利用监督学习对网络参数进一步优化,并对输出权值调整.使网络不仅具有最优的拓扑结构,而且又具有较强的映射能力.对驾驶员的疲劳程度进行识别,得到了满意的结果.  相似文献   

20.
将DTNB、OneR和BP神经网络算法集成用于P2P流量识别,构建了基于该集成学习算法的P2P流量识别模型。利用网络流量特征和机器学习中生成规则的集成分类算法将网络流量分为P2P流量和非P2P流量。所建立的P2P流量识别模型分为网络流量特征的获取、P2P流量特征选取以及建立流量分类模型三个步骤。采用十折交叉验证与测试集相结合的方法CTFCVWTS(combining T-fold cross validation with testing set)评估模型的合理性和提出方法的有效性。实验得出流量分类准确率平均为97.27%。结果表明,该模型具有较高的P2P流量识别准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号