首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
对多Agent系统的Q值强化学习算法进行研究,将历史信息因素的影响添加到Q值学习中,提出了一个新的基于多Agent系统的Q值学习算法.该算法在保证多Agent系统利益达到相对最大化的同时,也有效降低了Agent之间的冲突率.最后,通过仿真测试验证了该算法的有效性.  相似文献   

2.
针对将单AgentQ-学习协作算法直接扩展到多Agent系统会导致状态-动作对集合的急剧膨胀、从而影响多Agent的协作学习速度的问题,提出了基于实用推理的多Agent协作强化学习算法.在实用推理框架下,首先在慎思过程中通过考虑群体意图来确定单个Agent的子意图;然后,在手段-目的推理过程中采用Q-学习算法得出实现子意图的最优策略,从而实现群体意图.在Q-学习算法中,各Agent只需考虑自身的状态-动作的值函数更新,对其他Agent值函数的更新可以不加考虑,从而大大降低了算法的空间复杂度,提高了学习速度.追捕问题的仿真实验结果验证了算法的有效性.  相似文献   

3.
基于智能体 (Agent)系统强化学习原理和基于动态规划的Q -学习算法的基础上 ,提出了一种新的Agent强化学习算法 .该算法在Agent学习过程中不断调整Agent知识库的加权值 ,在强化学习的每个阶段 ,通过选取合适的信度分配函数来修正Agent强化学习动作的选取策略 .与标准的Q -学习方法相比 ,具有更加合理的物理结构 ,并且能保证算法收敛 .仿真实验说明该方法加快了标准Q -学习算法的收敛速度 ,具有较好的学习性能  相似文献   

4.
针对电梯群控系统这一类复杂的派梯优化决策问题,应用多Agent的理论与技术,建立了系统强化学习模型.提出了一种基于GA算法的多Agent强化学习方法,给出了具体算法的一般描述.建立电梯群控调度系统的虚拟仿真环境,并与其他算法进行了对比研究.仿真结果表明:该方法在提高强化学习的效率和收敛速度,改善种群结构等方面收到了很好的求解效果,为电梯群控系统的优化调度决策提供了一种较好的途径.  相似文献   

5.
基于多智能体和模糊控制的道路交叉口建模与仿真   总被引:1,自引:1,他引:0       下载免费PDF全文
利用Agent技术对道路交叉口进行建模,着重介绍了交叉口Agent的内部结构和控制策略.在交叉口控制中应用模糊理论和蚁群算法,提出了一种具有自学习机制的交叉口信号模糊控制方法.对模糊控制规则应用蚁群算法进行优化,使得交叉口Agent具有自学习能力.编制交叉口Agent的仿真程序,将所研究模型的控制效果与传统模糊控制模型的效果进行了比较.仿真实验的结果表明:具有自学习机制的交叉口信号模糊控制方法的效果明显优于传统的模糊控制方式.  相似文献   

6.
给出了基于Agent的多电梯智能群控系统结构,并对其中的状态协调Agent以及调度Agent进行了深入研究,在分析电梯乘客需求的随机性与周期性特点的基础上,给出了建立客流模板的学习算法.根据乘客的现实需求和预测得出的潜在需求对梯群预测调度,给出了选择客流模板的算法和基于乘客需求预测的最大引力派梯算法.该方法能够利用预测的乘客需求,尽量减小调度的滞后性,从而减少乘客的平均候梯时间及长时间等待率.仿真结果显示了该方法的优越性.  相似文献   

7.
从认知的和社会的角度分析了协同设计活动,提出了一种面向协同设计的多Agent系统结构和设计Agent的感知模型,以及多Agent协同强化学习的方法.该方法采用动态小生境技术对设计Agent进行分组,并选出每组中的最优设计Agent,使其通过与设计人员交互进行强化学习,然后和其他组选出的Agent协同学习,并把学到的知识在组内进行传播.以齿轮减速器设计为例,介绍了多Agent协同设计系统的协同设计及学习过程.  相似文献   

8.
管制员Agent是空中交通运行仿真系统中的核心部分,为了提高其知识库的完备程度,做到空中交通的精确仿真,可以考虑将机器学习理论引入管制员Agent模型.研究了相关机器学习算法,提出管制员Agent的个体机器学习行为,选择Q学习算法对管制员Agent的学习行为进行建模,使管制员Agent能在空中交通运行仿真中取得最优策略,完善自身冲突解脱知识库的不足.仿真结果证明了管制员Agent学习行为的合理性.  相似文献   

9.
动态环境下的多智能体机器人协作模型   总被引:2,自引:0,他引:2  
提出了在动态环境中,多Agent的一种协作模型,适用于环境信息不完备的复杂情况.将Agent的独立强化学习与BDI模型结合起来,使多Agent系统不但拥有强化学习的高度反应性和自适应性,而且拥有BDI的推理能力,使只使用数值分析而忽略推理环节的强化学习结合了逻辑推理方法.使用了Borlzman选取随机动作,并且采用了新的奖励函数和表示方法,减少了学习空间,提高了学习速度.仿真结果表明所提方法可行,能够满足多Agent系统的要求.  相似文献   

10.
将预测分析技术和强化学习技术有机结合,使多Agent系统中的各Agent,不仅具有了高度反应自适应性,而且拥有了高效而准确的预测分析能力;使Agent的行为更具有针对性,尽可能地减少错误,保证学习的正确方向,提高Agent间进行信息共享,融合单个Agent的Q值表.相当于相同情况下增加了学习次数,不仅尽可能地消除策略中的冗余动作,以高效的方式实现最终目标,而且提高多Agent系统执行效率和收敛速度及性能.本文提出了一种改进的多Agent间协作学习方法,适用于环境不完备的复杂情况.以追捕问题作为仿真实验.结果表明所提方法能够有效地促进多智能体系统中各Agent间协作学习能力.  相似文献   

11.
提出了一个基于自组织多Agent系统的智能控制与决策模型,它是一种基于行为主义的智能控制与决策模型,由环境和自组织多Agent系统两大部件构成,分别通过环境的定义、环境的识别、多Agent控制与决策过程以及多Agent控制与决策输出4个基本步骤来完成建模工作.该模型可以灵活地选择多种算法进行具体的实现工作,文中给出的算法是一种基于作用力机制(物理激励)的多Agent控制与决策算法,该算法是通过模仿经典物理学理论中的万有引力定律,将多Agent系统中的自组织交互过程转化为相互的作用力,并通过交互作用力的大小和方向体现多Agent之间的交互机制,充分利用了多Agent系统的群体决策优势.测试实验结果表明,该模型具有较好的应用效果并且其系统能量在Agent数目为300、迭代次数超过80次时具有稳定性.  相似文献   

12.
基于压缩感知的无线传感器网络节点定位算法   总被引:1,自引:0,他引:1  
为了得到有效的、通用的定位算法,提出了两种新的定位算法——基于压缩感知的无线传感器网络节点定位算法(NLCS)及其改进算法(INLCS).NLCS算法利用压缩感知和加权质心算法进行节点位置估计.提出了伪跳数以改进NLCS算法,提升了算法的定位性能.这两种算法解决定位问题必须满足3个条件,使其更适合于实际应用.仿真结果表明,相对于LSRC和LSVM定位算法,这两种算法有更好的定位性能.  相似文献   

13.
标签防碰撞算法的优劣决定了RFID系统性能的好坏,针对标签识别的RFID系统前人已经提出了许多算法,但都有明显的缺点,包括识别速度慢、不稳定等.已有的算法主要分为两大体系:基于ALOHA的算法、查询树算法.基于混合查询树算法,引入时隙补偿机制和采用特定编码方式(曼彻斯特编码),由标签中每三位中1的个数,决定标签响应时隙,大大降低了碰撞时隙,提高了识别效率.  相似文献   

14.
中医是灿烂中华文化的一部分,数千年来为中华民族的生存和发展做出重大贡献,但仍沿用古老和不精确的理论。本文应用现代方法对其进行描述,试图推动中医理论的现代化。吉布斯自由能判据可预测生化反应能否自动发生,证实自由能可推动生化反应。"气"被定义为体内的自由能,可用物理方法来描述。"血"是体内有益的液体和固体物质。引入熵产生率函数来描述人体内不可逆过程的熵产生,论述它与健康状况之关系。"阴和阳"对应于身体的新陈代谢。新陈代谢是体内物理和化学过程的总称,其中合成过程把食物变成组织内的生命物质,即中医所说"阴成形";分解过程把大分子物质分解为更小、更简单的物质,同时释放出人体所需的自由能,即中医所说"阳化气"。人体"气血"状况和治病的效果可通过米氏方程来定量描述。  相似文献   

15.
分数傅里叶变换是传统傅里叶变换的发展和推广,在信息处理中有非常广泛的应用。文章对已发展的四种分数傅里叶变换离散化算法进行了系统的归纳和总结,重点比较了几种算法的优缺点,指出了适用范围,并对其中三种主要方法给出了计算机模拟结果;在此基础上,用解啁秋法对chirp信号进行了检测和滤波,并给出了仿真结果。  相似文献   

16.
遗传算法在数据挖掘中的应用   总被引:1,自引:0,他引:1  
本文对数据挖掘进行了概述,阐明了数据挖掘的概念、方法及其重要性。其次介绍了数据挖掘中的一个重要算法——遗传算法。对遗传算法的产生与发展以及主要理论等进行了简要的介绍,提出了基于遗传算法的关联规则的提取方法。最后结合实例给出了用遗传算法进行关联规则的挖掘方法。  相似文献   

17.
古代汉语中兼具两个相反义的词很多,在这些词中,有一类兼具“授”、“受”两个相反义。“授”即“给予”、“交出”、“付给”;“受”即“索要”、“收取”、“接受”。这类词两个相反义的形成与古汉语中的词义引申有关。因为“授”、“受”是一个交接过程的两个方面,两者关系密不可分,可以相互引申。  相似文献   

18.
量词“束”和“捆”在过程性上存在着差异。从起点看,“束”用于较细的长条物,“捆”用于较粗的长条物;从途径看,“束”为束缚而成,“捆”为捆绑而成;从终点看,“束”的集合体为细长状,“捆”的集合体为粗大状。“束”和“捆”的差异虽然在本质上是共时的,但也和语言的历史发展密切相关。  相似文献   

19.
近代汉语中肯定式的测度问句“莫VP?”和否定式的测度问句“莫不VP?”句末均不排斥用否定词neg,“莫VP—neg?”、“莫不VP.neg?”句末的neg均是否定词,并未虚化为语气词。“莫VP.neg?”是测度问句“莫VP?”与正反问句“VP—neg?”糅合的产物,“莫不VP—neg?”是测度问句“莫不VP?”与正反问句“不VP—neg?”糅合的产物。  相似文献   

20.
《大宋重修广韵》中的两个韵字“[犭遀]”、“鬀”的讹夺现象尚未引起前修时贤的关注,“[犭遀]”为“[犭隨]”,形夺“阝”而误、“鬀”为“鬄”形似而讹,讹误的原因一是未细考文献,二是不明古音。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号