首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
针对单轨双轮机器人在静止情况下存在的固有静态不稳定问题, 提出一种基于模糊强化学习(简称为Fuzzy-Q)的控制方法。首先,运用拉格朗日法建立带控制力矩陀螺的系统动力学模型。然后, 在此基础上设计表格型强化学习算法, 实现机器人的稳定平衡控制。最后,针对算法存在的控制精度不高和控制器输出离散等问题, 采用模糊理论泛化动作空间, 改善控制精度, 并使控制输出连续。仿真实验表明, 相较于传统强化学习方法, 所提方法能够显著提高控制精度, 且可以有效抑制外界干扰力矩对系统的影响, 保证系统具有一定的抗干扰能力。  相似文献   

2.
三级倒立摆系统模糊控制器设计及仿真   总被引:9,自引:0,他引:9  
提出了一种借助于系统的线性化模型设计三级倒立摆系统模糊控制器的方法。这种方法将线性系统理论与模糊控制技术相结合,将单一的复杂控制策略转化为多级控制策略嵌套,大大简化了三级倒立摆系统模糊控制器的设计步骤。仿真结果表明,该方法是可行性的。  相似文献   

3.
在保持可操纵性的前提下,提高车辆制动效能是设计防抱制动系统的主要目的,为此,设计了防抱制动系统的模糊模型参考学习控制器,由于该控制器引入了模糊学习机制,通过观察被控对象和代表理想动态性能的参考模型的输出差,从而调整模糊控制器的规则集,以使对象输出跟踪参考模型的输出,而后建立了直线制动车辆系统的数学模型,基于MATLAB/SIMULINK工具箱,并对所设计的模糊模型参考学习控制系统在不同的路面状态下进行了模拟,仿真结果表明,该控制方案是合理可行的。  相似文献   

4.
针对Boost变换器母线电压稳定控制存在模型不确定性和非线性的问题,提出了一种基于无模型深度强化学习的智能控制策略。结合强化学习DDQN(double DQN)算法与DDPG算法设计了Boost变换器控制器,包括了状态、动作空间、奖励函数以及神经网络的设计以提高控制器动态性能;基于ModelicaGym库开发工具包reinforment learning modelica(RLM)实现了Boost变换器模型与强化学习智能体的联合仿真。通过与双环PI控制器的对比仿真表明:强化学习控制器在三种工况下的母线电压稳定控制结果具有更好的动态性能。  相似文献   

5.
针对于机器人无标定视觉伺服问题,提出一种基于支持向量回归机(Support Vector Regression, SVR)学习的模糊控制(Fuzzy Logic Control, FLC)方法。FLC直接用于构建图像特征与机器人关节运动之间的非线性映射关系。FLC的模糊基函数用作SVR的核函数,建立FLC与SVR的数学等价关系。SVR从数据中学习的支持向量构建FLC的规则。所有规则来自于数据,因此无需人工设计规则。本文所提出方法充分利用了SVR针对小数据量学习具有较好的泛化性能优势,实验结果表明该视觉伺服控制器在精度上及收敛上均具取得较好性能。  相似文献   

6.
薛花  姜建国 《系统仿真学报》2006,18(11):3324-3327
结合传统模型参考自适应方法控制性能优越的特性和模糊控制不依赖对象精确数学模型的优势,将模糊控制器植入模型参考自适应控制系统构架中。主模糊控制器用于取代传统模型参考自适应控制中的反馈控制器,模糊逆模型结合自适应调整算法取代复杂的常规自适应规则,利用模糊控制良好的非线性学习特性,构建模糊自适应控制机构。以永磁同步电机为例,在MATLAB/Simulink环境下建立双闭环控制系统,基于扩展卡尔曼滤波设计速度观测器,基于模糊模型参考自适应方法设计速度控制器,仿真结果表明:控制系统运行平稳,速度跟踪快速准确,具有良好的动、静态特性。  相似文献   

7.
对于许多实际的非线性系统,状态变量往往不能获取或难于测量。因此设计模糊状态观测器来估计状态变量是非常必要的。针对T-S模糊模型近似描述的非线性系统,提出了一种基于线性矩阵不等式(LMI)的具有区域极点配置功能的模糊控制器和模糊状态观测器的设计方法。首先利用并行分布补偿(PDC)设计思想和基于线性矩阵不等式(LMI)的极点配置理论,将闭环系统的全局渐进稳定性要求,性能指标及控制量约束条件统一到线性矩阵不等式框架内。然后求解线性矩阵不等式族获得控制器和观测器参数。最后将该设计方法应用于倒立摆的平衡控制中,通过仿真曲线可以看出该方法设计的控制器可使倒立摆稳定并满足指定的性能指标,因此该设计方法是有效的。  相似文献   

8.
一类时滞系统的模糊跟踪控制及其仿真   总被引:1,自引:0,他引:1  
研究了一种基于模糊T-S模型的非线性时滞系统模糊跟踪控制问题。首先利用模糊T-S模型对不确定非线性系统进行模糊建模,然后在此基础上研究了模糊系统在状态可测与不可测的情况下的模糊跟踪问题。控制器的设计避开了复杂的精确反馈线性化与自适应方法。采用本方法,可将控制器的设计问题转化为求解线性矩阵不等式问题,再利用凸优化技术可将其有效地解决。因此该方法既简单又实用,并且通过仿真实例说明了它的有效性与正确性。  相似文献   

9.
迭代学习控制(iterative learning control, ILC)方法应用于网络控制系统时,由于数据需要在控制器和远程对象间传输经常产生数据丢失现象。给出了一种存在数据丢失时网络系统的随机迭代学习控制设计方法,首先将数据丢失现象描述为随机伯努利序列,在此基础上将迭代学习的控制器设计转化为随机〖JP2〗2D Roesser系统的稳定问题。定义了随机意义下2D系统的均方渐进稳定,基于线性矩阵不等式(linear matrix inequality, LMI)给出一个判别稳定性的条件,该条件同时可实现迭代学习控制器的设计。仿真示例验证了设计方法的有效性。  相似文献   

10.
李毅  彭勤科  胡保生 《系统仿真学报》2005,17(6):1307-1310,1314
提出将自组织模糊神经网络(SCFNN)应用于网络控制系统(NCS)中的远程控制器的设计。SCFNN的学习过程包托结构学习和参教学习两个阶段。结构学习的目的是对输入空间进行合理的模糊划分并动态地生成一组模糊逻辑控制规则,而参数学习是通过有监督梯度下降法来调整隶属度函数的参数以及模糊规则中结论部分的权值。最初的SCFNN只有输入节点和输出节点,而经过在线学习后逐步生成隶属度函数节点和规则节点。对基于Profibus-DP网络的网络控制系统进行测试,并与采用修正Ziegler-Niehols法设计的控制器的控制效果进行比较,结果表明基于SCFNN思想设计的远程控制器在网络控制系统中能够获得满意的控制效果。  相似文献   

11.
提出了一种基于模糊逻辑的混联式电动汽车功率分配控制策略,功率分配控制器的核心是规则库,它由制动规则库、燃油经济性规则库、加速性能规则库以及校正模块等四个独立的规则库组成。利用已建立的四驱混合电动汽车模型对其燃油经济性进行计算机仿真表明:采用模糊控制策略比传统控制策略的百公里油耗在市区(FUDS)和高速(FHDS)工况下均下降了约10%。  相似文献   

12.
宗群  孙正雅  宋超峰 《系统仿真学报》2007,19(21):4945-4948
针对电梯群控系统,建立基于平均报酬强化学习的优化调度模型。采用R-learning的平均报酬强化学习求解算法,在分析电梯群组调度问题特点的基础上,利用径向基函数神经网络解决行为值函数的存储与泛化问题,并结合电梯群组虚拟仿真环境进行验证。通过与两种典型的电梯群组调度算法进行比较,展示了平均报酬强化学习算法在处理具有吸收目标状态的大规模随机序贯决策问题的有效性及可行性。  相似文献   

13.
针对一类不确定非线性系统,利用输入到状态实际稳定理论(ISpS)、小增益定理,结合T-S模糊逻辑系统在线逼近系统的未知函数,在状态向量不完全可测的情况下,提出一种基于观测器的直接鲁棒自适应模糊控制的新方法。理论分析证明了闭环系统半全局一致终结有界,只有两个参数需要在线调节,同时避免了在一些自适应控制中由于采用线性反馈技术而可能引起的控制增益的奇异问题。仿真结果表明了该方法的有效性。  相似文献   

14.
策略重用(policy reuse,PR)作为一种迁移学习(transfer learning,TL)方法,通过利用任务之间的内在联系,将过去学习到的经验、知识用于加速学习当前的目标任务,不仅能够在很大程度上解决传统强化学习(reinforcement learning,RL)收敛速度慢、资源消耗大等问题,而且避免了在...  相似文献   

15.
考虑了一类特殊的迭代学习控制问题,即用迭代学习方法解决机器人的点位控制问题。采用T-S模型描述机器人系统,在T-S模型的基础上,运用并行分配补偿方法(PDC)确定T-S模型的迭代学习控制器结构,并给出了误差收敛条件。为避免迭代过程的初始定位操作,丈中还设计了模糊循环迭代学习律。最后以在垂直面内运动的单关节的机器人为例说明了所提出方法的有效性。  相似文献   

16.
针对舰载飞机恶劣、复杂的着舰环境,提出了一种在原军用推力操纵的基础上,加入具有保持迎角恒定的升降舵模糊控制的新的复飞决策系统。给出了复飞边界准则,设计了升降舵的模糊控制器,建立了复飞区,并对具有复飞决策系统的舰载机自动着舰导引系统进行仿真验证。仿真结果表明,提出的新复飞决策系统有效地增强了低动压状态下飞机的机动能力,明显地缩小了复飞边界区,减小了复飞包线的范围,从而消除了不必要的复飞,提高了着舰概率,从而增加了着舰的安全性。  相似文献   

17.
1.INTRODUCTIONBank-tthturn(BTT)[1]andskid-tDeturn(STT)aretwogeneralmethodsofcontrollingtheattitudeofamissiletoachievetheaccelerationcoxnmandedbytheguidancelaw.BTT~ifeshavehighmaneuverabilitycomparedwithSTTInissiles,soBTTcontroltechllologybecomesacolltinualhotprobleminthefieldsofaerodynamics,guidance,colltrolandnavigstinnduringthepast20years.However,thelargerollrate,whichisgeneratedinevitablywhenBTTmissilesrapidlychangetheorielltationoftheaccelerationtoexecuteaBacsteeringpolicy,will…  相似文献   

18.
王永富  柴天佑 《系统仿真学报》2005,17(10):2442-2446
针对一类多输入多输出非线性系统设计了自适应模糊观测器和控制器。该方法不需要系统状态完全可测的条件,而是通过自适应模糊观测器估计系统的状态。采用基于状态估计的模糊基函数模型的模糊逻辑系统逼近非线性函数,并对模糊建模误差和外扰的存在采用了鲁棒补偿控制项以保证良好的观测与跟踪性能,该控制器保证了跟踪误差和观测误差的一致最终有界性。仿真结果表明所提出的方法具有良好的观测效果与跟踪效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号