首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
多智能体遗传算法用于超高维函数优化   总被引:13,自引:2,他引:13  
基于智能体对环境的感知与反作用的能力提出了一种新的函数优化方法--多智能体遗传算法.该方法将智能体固定在网格上,而每个智能体为了增加自身能量将与其邻域展开竞争或合作,同样,智能体也可利用自身的知识进行自学习来增加能量.理论分析证明算法具有全局收敛性.实验结果表明,多智能体遗传算法对维数高达甚至10000的函数,都能以较少的计算量获得高质量的解,充分说明算法具有很快的收敛速度.  相似文献   

2.
求解动态背包问题的多智能体进化算法   总被引:1,自引:0,他引:1  
针对动态背包问题,提出了一种基于多智能体的进化算法(MAEA).通过智能体相互合作地模拟生物机制特征来寻求最优解.智能体生存于网格环境中,为了增加自身能量,智能体可以与其邻域展开竞争,并依据统计信息来获得知识进行学习.为了保持种群的多样性,在算法中引入了随机移民机制.通过对一系列动态背包问题的仿真实验可以看出,在离线性能指标下,这种引入了随机移民机制的基于多智能体的动态进化算法相比几类遗传算法可以获得更好的性能.  相似文献   

3.
用于高维函数优化的多智能体量子进化算法   总被引:1,自引:0,他引:1  
基于智能体的竞争和学习能力、量子计算理论及生物进化策略,提出了一种新的优化方法——多智能体量子进化算法.一个智能体代表优化问题的一个可能解,所有的智能体都以量子染色体表示.该算法将智能体分布于多智能体网络环境中,智能体之间通过量子进化来实现竞争及学习,以提高个体的竞争能力.理论证明该算法具有全局收敛性.实验结果表明,该算法具有强的全局寻优能力及快速搜索能力。  相似文献   

4.
为研究行为未知的非线性多智能体系统领导-跟随者最优一致控制问题,针对智能体动态方程未知的情况,设计神经网络辨识器学习智能体动力学行为;构造以多智能体系统局部误差为输入的性能指标函数,将多智能体系统领导-跟随者一致性问题转换为求解智能体局部性能指标函数最优值的优化控制问题;结合自适应动态规划思想设计分布式迭代算法求解该优化问题,并讨论了算法的收敛性;设计基于神经网络的评价-执行结构分布式控制器来近似局部性能指标函数,通过神经网络学习迭代寻找局部性能指标函数的最优解,实现多智能体系统的最优一致控制策略。设计的分布式控制器能够根据智能体状态数据自适应产生控制策略,使多智能体系统趋于一致。  相似文献   

5.
以机器人足球比赛(RoboCup)为背景,基于主智能体和辅助智能体概念,提出了基于主智能体群体强化学习算法(GLBMA),该算法通过主智能体和辅智能体的角色切换来实现整个团队的学习,改进了传统的群体强化学习算法。RoboCup仿真比赛试验表明,传统群体强化学习算法中的行为学习状态空间过大,连续状态空间的行为选择及多智能体合作求解等问题得到了解决.  相似文献   

6.
传统的深度强化学习算法在解决任务时与环境交互量大且样本复杂度高,导致智能体的训练时间长,算法难以收敛,故在实际问题中的应用受限.针对该问题,在智能体采用梯度下降方法更新模型参数的过程中融入元学习思想,提出一种改进的深度强化学习算法,使得智能体利用在训练任务中学习到的先验知识快速地适应新任务.仿真结果表明:改进的深度强化学习算法可实现智能体在新任务上的快速适应,其收敛速度和稳定性等均优于传统算法.  相似文献   

7.
针对具有控制时延的非线性多智能体系统模型,设计了一种能够实现其稳定编队的迭代学习控制算法.首先,建立单个智能体的动态特性,根据多智能体的拓扑连接结构,将多智能体编队控制问题转化为跟踪问题.其次,针对每个智能体设计形式统一的迭代学习控制器,根据每个智能体不同的动态特性,选取合适的学习增益矩阵.最后,基于λ范数理论证明了算法的收敛性.由于该迭代学习控制算法放宽了对迭代初值的限定,使其达到在任意常值初态条件下的稳定控制,从而满足了各个智能体在初始位置随机分布时的编队控制要求.仿真结果证明了文中所给算法的有效性.  相似文献   

8.
提出一种多智能体增强式学习方法,每个智能体在学习过程中将其他智能体和环境区分开来,并且通过维持其他智能体的替代传导径迹来预测它们的行为,从而也确定了自身的行为。该算法不需要知道其他智能体的Q函数结构和奖赏函数结构,适用条件宽松。仿真结果证明了所提出学习算法的有效性,而且相对于集中式Q学习效率有很大的提高。  相似文献   

9.
提出了一种基于群体智能的设备性能横向比较算法,该算法将设备模式投影于二维平面上,然后依据群体智能聚类,实现设备性能的自组织聚类分析.为了提高群体智能聚类算法的运行效率,提出了利用主成分分析改善模式投影时的随机性.此外,为了减小参数选取对算法的影响,提出了一种更简单的相似度衡量公式.将改进后的算法与原算法进行比较,结果显示,改进算法的运行效率更高.利用改进算法对某中央空调的数据进行分析,验证了算法能满足设备性能自组织聚类的要求.  相似文献   

10.
大规模多智能体仿真平台设计方法的研究   总被引:1,自引:0,他引:1  
大规模多智能体系统是分布式人工智能领域的一个研究热点,由于多智能体间复杂的交互过程受到诸多不确定性因素的影响,实现系统的宏观优化是关键难点.前期研究发现,某一参数的小范围变化可能引起整个多智能体系统性能的大范围的波动;并且多智能体控制协作算法的研究多数仅与非智能的控制方法进行简单对比,缺乏通用的仿真平台来抽象系统环境并模拟复杂的多智能体行为.为此设计了一种通用的大规模多智能体协同控制平台,该平台能够模拟多智能体系统必须完成的协同控制任务,并且通过变换多智能体系统的相关参数模型及加载不同的智能体控制策略,可以模拟和评测系统各项协作性能指标,为未来设计和提升算法性能提供研究基础.  相似文献   

11.
针对城市环道交通信号控制问题,利用多智能体系统自主性、分布性、协调性、主动学习等特性,提出基于多智能体的环道交叉口绿波协调方法,将每个环道交叉口都看作一个智能体,相邻智能体间能够进行信息的互通交流,利用智能体系统记忆存储以及推理学习能力,对环道上的多个交叉口进行绿波协调优化,从算法模型与参数描述、协调方式的相位选择策略等角度对所提算法进行描述和推导,并通过实验仿真验证了所提的算法的有效性.  相似文献   

12.
为了有效延长WSN网络的生存时间,需要设计能量有效的自组织成簇机制,以适应无线传感器网络的特点.提出了一种适合无线传感器网络能量有效的成簇优化模型,并使用微粒群优化算法(PSO)对该模型进行求解.为了使微粒群算法适合于该问题的求解,设计了适合微粒群算法的微粒位置向量和速度向量的更新机制,并用罚函数法对两个主要约束进行了处理,给出了适应值函数,并通过MATLAB 7.1进行了实例仿真.仿真结果表明,该优化模型是解决WSN能量问题的有效方法.  相似文献   

13.
文章研究了一阶多智能体系统的有限时间一致性控制问题.为了对下一时刻智能体系统的状态进行预测,加快系统收敛速度,提出算法将当前智能体间状态信息的差异作为一致性协议的反馈参数,该算法实现了对不同智能体输入的自适应调节,并使多智能体系统在有限时间内达到一致.通过构造Lyapunov函数的方法分别讨论无向固定拓扑和切换拓扑两种情形,得到多智能体系统的稳定条件,证明该协议能在有限时间内收敛.最后,仿真实验结果验证了所得结论的正确性和有效性.  相似文献   

14.
离心泵多工况水力设计方法   总被引:2,自引:0,他引:2  
针对现有的离心泵水力设计方法仅满足单点设计工况性能,无法满足其他工况性能的问题,提出一种离心泵多工况水力设计方法.以单点设计的关键几何参数值为初始条件、多工况的扬程为约束条件、多个工况的加权平均效率最高为目标,同时采用自适应模拟退火算法对离心泵多工况能量性能计算模型进行求解.最后根据比转数为129.3的离心泵3个工况点的能量性能要求,在考虑权重的基础上提出了2种多工况水力设计方案.数值计算结果表明:2种多工况设计能基本满足3个工况点的能量性能要求,误差均在5%以内.  相似文献   

15.
多目标控制参数联合优化整定是自动化系统保持高效、稳定运行的关键问题,强化学习常用于建立自动化调参智能体,代替人工完成参数整定. 针对现有方法使用固定权重将多个优化目标线性组合为单目标,训练具有固定调参知识的单智能体模型,导致实际目标关系受环境影响与先验不符时,智能体无法感知并做出适应性决策调整,限制参数整定效果的问题,提出一种面向多目标参数整定的协同深度强化学习方法. 该方法利用离线仿真学习目标整定知识建立多个Double-DQN智能体,在线建立整定效果反馈,感知目标实际关系并调整智能体协同策略,实现有效的多目标参数整定. 列车自动驾驶参数整定实验结果表明,方法对停车误差、舒适度两个目标整定效果良好,能自适应不同车轨性能且可持续优化,实用价值大.   相似文献   

16.
结合智能体对周围环境的感知能力和遗传算法的随机搜索能力,以及模拟退火算法的局部搜索能力,设计了一种多智能体混合遗传算法。智能体在已初始化的网格内进行邻域竞争、交叉、变异操作,然后独立地对各个智能体进行模拟退火操作,找到全局最优智能体。将该方法应用到理论模型的AVA岩性参数反演中,说明该方法是有效的。  相似文献   

17.
针对主动配电网电压优化控制中模型不确定性和通信代价大的问题,提出了一种基于灵敏度矩阵安全的多智能体深度强化学习(SMS-MADRL)算法。该算法利用安全深度强化学习,应对主动配电网的固有不确定性,并采用多智能体结构实现通信代价较小的分布式控制。首先,将电压优化控制问题描述为受约束的马尔可夫博弈(CMG);然后,对无功功率进行适当修改,通过分析节点电压的变化得到灵敏度矩阵,进而与主动配电网环境进行交互,训练出若干可以独立给出最优无功功率指令的智能体。与现有多智能体深度强化学习算法相比,该算法的优点在于给智能体的动作网络增添了基于灵敏度矩阵的安全层,在智能体的训练和执行阶段保证了主动配电网的电压安全性。在IEEE 33节点系统上的仿真结果表明:所提出的算法不仅能够满足电压约束,而且相较于多智能体深度确定性策略梯度(MADDPG)算法,网络损耗减少了4.18%,控制代价减少了70.5%。该研究可为主动配电网的电压优化控制提供理论基础。  相似文献   

18.
针对无人机群(swarm of unmanned aerial vehicle, UAV-swarm)在救灾场景中对地面移动用户进行持续性通信覆盖的问题,设计了一种基于多智能体的深度强化学习的无人机群路径优化算法。该算法框架中无人机具有分布式决策能力,根据用户的移动来动态调整自身的移动策略。通过设置合适的强化学习奖励和参数,使无人机在满足覆盖百分比、防碰撞、能源限制等多种约束前提下,最大限度地长期覆盖地面移动用户。与其他无人机部署方案算法进行仿真对比,实验结果表明,该模型在收敛速度和收敛效果上得到了显著提升。  相似文献   

19.
一种约束工程设计问题的入侵性杂草优化算法   总被引:5,自引:0,他引:5  
提出了一种新颖的求解约束问题的群智能优化算法.该算法模拟杂草克隆、占地生长与繁殖的自然行为,具有入侵性杂草的鲁棒性、适应性和随机性等特点,算法简单而有效,具有准确的全局搜索能力.结合罚函数方法将提出的算法应用于求解工程设计优化问题,实验结果及比较表明提出的算法获得了更优的结果,同时也显示了它在求解复杂工程设计优化问题时的全局寻优能力.进一步实验与统计分析了关于参数选择对算法性能的影响,得到了有利参数选择的结论.  相似文献   

20.
深入研究信任管理和行为信任的模型及方法,设计基于贝叶斯网络的信任预测和控制算法,综合利用聚类和分布密度函数设置算法参数,建立可量化的证据与信任等级之间的对应关系,算法可预测多属性下的行为信任等级.深入IIS和.Net底层实现可配置的信任管理插件,形成用户行为日志,为预测和控制算法提供证据, 免除了一般Web日志的清洗工作.实验数据表明算法的应用提高了服务器各项性能,并约束了用户的商业行为.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号