共查询到18条相似文献,搜索用时 156 毫秒
1.
针对单轨双轮机器人在静止情况下存在的固有静态不稳定问题, 提出一种基于模糊强化学习(简称为Fuzzy-Q)的控制方法。首先,运用拉格朗日法建立带控制力矩陀螺的系统动力学模型。然后, 在此基础上设计表格型强化学习算法, 实现机器人的稳定平衡控制。最后,针对算法存在的控制精度不高和控制器输出离散等问题, 采用模糊理论泛化动作空间, 改善控制精度, 并使控制输出连续。仿真实验表明, 相较于传统强化学习方法, 所提方法能够显著提高控制精度, 且可以有效抑制外界干扰力矩对系统的影响, 保证系统具有一定的抗干扰能力。 相似文献
2.
3.
4.
针对Boost变换器母线电压稳定控制存在模型不确定性和非线性的问题,提出了一种基于无模型深度强化学习的智能控制策略。结合强化学习DDQN(double DQN)算法与DDPG算法设计了Boost变换器控制器,包括了状态、动作空间、奖励函数以及神经网络的设计以提高控制器动态性能;基于ModelicaGym库开发工具包reinforment learning modelica(RLM)实现了Boost变换器模型与强化学习智能体的联合仿真。通过与双环PI控制器的对比仿真表明:强化学习控制器在三种工况下的母线电压稳定控制结果具有更好的动态性能。 相似文献
5.
针对于机器人无标定视觉伺服问题,提出一种基于支持向量回归机(Support Vector Regression, SVR)学习的模糊控制(Fuzzy Logic Control, FLC)方法。FLC直接用于构建图像特征与机器人关节运动之间的非线性映射关系。FLC的模糊基函数用作SVR的核函数,建立FLC与SVR的数学等价关系。SVR从数据中学习的支持向量构建FLC的规则。所有规则来自于数据,因此无需人工设计规则。本文所提出方法充分利用了SVR针对小数据量学习具有较好的泛化性能优势,实验结果表明该视觉伺服控制器在精度上及收敛上均具取得较好性能。 相似文献
6.
结合传统模型参考自适应方法控制性能优越的特性和模糊控制不依赖对象精确数学模型的优势,将模糊控制器植入模型参考自适应控制系统构架中。主模糊控制器用于取代传统模型参考自适应控制中的反馈控制器,模糊逆模型结合自适应调整算法取代复杂的常规自适应规则,利用模糊控制良好的非线性学习特性,构建模糊自适应控制机构。以永磁同步电机为例,在MATLAB/Simulink环境下建立双闭环控制系统,基于扩展卡尔曼滤波设计速度观测器,基于模糊模型参考自适应方法设计速度控制器,仿真结果表明:控制系统运行平稳,速度跟踪快速准确,具有良好的动、静态特性。 相似文献
7.
对于许多实际的非线性系统,状态变量往往不能获取或难于测量。因此设计模糊状态观测器来估计状态变量是非常必要的。针对T-S模糊模型近似描述的非线性系统,提出了一种基于线性矩阵不等式(LMI)的具有区域极点配置功能的模糊控制器和模糊状态观测器的设计方法。首先利用并行分布补偿(PDC)设计思想和基于线性矩阵不等式(LMI)的极点配置理论,将闭环系统的全局渐进稳定性要求,性能指标及控制量约束条件统一到线性矩阵不等式框架内。然后求解线性矩阵不等式族获得控制器和观测器参数。最后将该设计方法应用于倒立摆的平衡控制中,通过仿真曲线可以看出该方法设计的控制器可使倒立摆稳定并满足指定的性能指标,因此该设计方法是有效的。 相似文献
8.
9.
迭代学习控制(iterative learning control, ILC)方法应用于网络控制系统时,由于数据需要在控制器和远程对象间传输经常产生数据丢失现象。给出了一种存在数据丢失时网络系统的随机迭代学习控制设计方法,首先将数据丢失现象描述为随机伯努利序列,在此基础上将迭代学习的控制器设计转化为随机〖JP2〗2D Roesser系统的稳定问题。定义了随机意义下2D系统的均方渐进稳定,基于线性矩阵不等式(linear matrix inequality, LMI)给出一个判别稳定性的条件,该条件同时可实现迭代学习控制器的设计。仿真示例验证了设计方法的有效性。 相似文献
10.
提出将自组织模糊神经网络(SCFNN)应用于网络控制系统(NCS)中的远程控制器的设计。SCFNN的学习过程包托结构学习和参教学习两个阶段。结构学习的目的是对输入空间进行合理的模糊划分并动态地生成一组模糊逻辑控制规则,而参数学习是通过有监督梯度下降法来调整隶属度函数的参数以及模糊规则中结论部分的权值。最初的SCFNN只有输入节点和输出节点,而经过在线学习后逐步生成隶属度函数节点和规则节点。对基于Profibus-DP网络的网络控制系统进行测试,并与采用修正Ziegler-Niehols法设计的控制器的控制效果进行比较,结果表明基于SCFNN思想设计的远程控制器在网络控制系统中能够获得满意的控制效果。 相似文献
11.
12.
13.
针对一类不确定非线性系统,利用输入到状态实际稳定理论(ISpS)、小增益定理,结合T-S模糊逻辑系统在线逼近系统的未知函数,在状态向量不完全可测的情况下,提出一种基于观测器的直接鲁棒自适应模糊控制的新方法。理论分析证明了闭环系统半全局一致终结有界,只有两个参数需要在线调节,同时避免了在一些自适应控制中由于采用线性反馈技术而可能引起的控制增益的奇异问题。仿真结果表明了该方法的有效性。 相似文献
14.
策略重用(policy reuse,PR)作为一种迁移学习(transfer learning,TL)方法,通过利用任务之间的内在联系,将过去学习到的经验、知识用于加速学习当前的目标任务,不仅能够在很大程度上解决传统强化学习(reinforcement learning,RL)收敛速度慢、资源消耗大等问题,而且避免了在... 相似文献
15.
基于T-S模型的迭代学习控制算法及其在机器人点位控制中的仿真研究 总被引:3,自引:2,他引:3
考虑了一类特殊的迭代学习控制问题,即用迭代学习方法解决机器人的点位控制问题。采用T-S模型描述机器人系统,在T-S模型的基础上,运用并行分配补偿方法(PDC)确定T-S模型的迭代学习控制器结构,并给出了误差收敛条件。为避免迭代过程的初始定位操作,丈中还设计了模糊循环迭代学习律。最后以在垂直面内运动的单关节的机器人为例说明了所提出方法的有效性。 相似文献
16.
17.
《系统工程与电子技术(英文版)》1998,(4)
1.INTRODUCTIONBank-tthturn(BTT)[1]andskid-tDeturn(STT)aretwogeneralmethodsofcontrollingtheattitudeofamissiletoachievetheaccelerationcoxnmandedbytheguidancelaw.BTT~ifeshavehighmaneuverabilitycomparedwithSTTInissiles,soBTTcontroltechllologybecomesacolltinualhotprobleminthefieldsofaerodynamics,guidance,colltrolandnavigstinnduringthepast20years.However,thelargerollrate,whichisgeneratedinevitablywhenBTTmissilesrapidlychangetheorielltationoftheaccelerationtoexecuteaBacsteeringpolicy,will… 相似文献
18.
针对一类多输入多输出非线性系统设计了自适应模糊观测器和控制器。该方法不需要系统状态完全可测的条件,而是通过自适应模糊观测器估计系统的状态。采用基于状态估计的模糊基函数模型的模糊逻辑系统逼近非线性函数,并对模糊建模误差和外扰的存在采用了鲁棒补偿控制项以保证良好的观测与跟踪性能,该控制器保证了跟踪误差和观测误差的一致最终有界性。仿真结果表明所提出的方法具有良好的观测效果与跟踪效果。 相似文献