首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
将预测分析技术和强化学习技术有机结合,使多Agent系统中的各Agent,不仅具有了高度反应自适应性,而且拥有了高效而准确的预测分析能力;使Agent的行为更具有针对性,尽可能地减少错误,保证学习的正确方向,提高Agent间进行信息共享,融合单个Agent的Q值表.相当于相同情况下增加了学习次数,不仅尽可能地消除策略中的冗余动作,以高效的方式实现最终目标,而且提高多Agent系统执行效率和收敛速度及性能.本文提出了一种改进的多Agent间协作学习方法,适用于环境不完备的复杂情况.以追捕问题作为仿真实验.结果表明所提方法能够有效地促进多智能体系统中各Agent间协作学习能力.  相似文献   

2.
基于历史信息和时间约束的多Agent协商模型   总被引:1,自引:1,他引:0  
协商是多Agent系统(Multi-Agent Systems:MAS)实现协调、协作和冲突消解的关键环节.如何在不完全信息的情况下构造有效的协商模型来提高Agent的协商能力,是多Agent系统研究中占有重要地位的问题之一.通过考虑历史信息和时间约束的情况下,讨论了多Agent多问题的协商类型,提出了基于历史信息和时间约束的协商模型(HTANM)和协商算法,为多Agent能进行自动协商奠定了一定的基础.  相似文献   

3.
对多Agent系统的Q值强化学习算法进行研究,将历史信息因素的影响添加到Q值学习中,提出了一个新的基于多Agent系统的Q值学习算法.该算法在保证多Agent系统利益达到相对最大化的同时,也有效降低了Agent之间的冲突率.最后,通过仿真测试验证了该算法的有效性.  相似文献   

4.
在开放、动态、具有自适应性和自治性的多Agent系统(MAS)中,协商是多Agent系统实现协调、协作和解决冲突的关键.博弈论是使用严谨的数学模型研究冲突条件下最优决策问题的理论,本文以此为数学工具,基于对时间的限制,结合协商的历史知识,考虑各协商者在拥有不完全信息的情况下,提出了基于博弈论的多Agent协商模型(GTMANM),并给出了协商策略求解的算法描述,用以来解决分布式环境下不完全信息的多人协商决策问题,以获得最大的期望收益,为以后把博弈论中其他更复杂的博弈思想引入到多Agent协商中来奠定了基础.  相似文献   

5.
基于智能体 (Agent)系统强化学习原理和基于动态规划的Q -学习算法的基础上 ,提出了一种新的Agent强化学习算法 .该算法在Agent学习过程中不断调整Agent知识库的加权值 ,在强化学习的每个阶段 ,通过选取合适的信度分配函数来修正Agent强化学习动作的选取策略 .与标准的Q -学习方法相比 ,具有更加合理的物理结构 ,并且能保证算法收敛 .仿真实验说明该方法加快了标准Q -学习算法的收敛速度 ,具有较好的学习性能  相似文献   

6.
关于Agent个体的机器学习一直是Agent研究的一个重要方面,本文对再励学习中的Q学习算法做了简单介绍,然后在一个基于Agent的机器人足球赛平台上将Q学习算法引入,并进行了对比实验。  相似文献   

7.
智能仿真支撑环境H-MAS   总被引:1,自引:0,他引:1  
引入分布式人工智能中多Agent的概念,将HLA仿真技术框架和多Agent技术相结合性,提出了一种具有智能特性的H-MAS仿真支撑,在此环境下充分利用Agent所具备的驻留性、自主性,反应性,协作性和连续性等诸多特性,实现了一个通用的Agent仿真对象模型,并构造了一个由Agent控制器和KQML语言处理器组成的通信对象,用以完成Agent间的互操作,最后阐述了H-MAS系统的工作流程,实验证明,H-MAS不仅保留了HLA的全部服务功能,而且具有较强的智能化处理能力,是建模与仿较为理想的智能化实验平台。  相似文献   

8.
将个性行为绑定到信息Agent上,提出了一种基于个性的协同强化学习算法,让不同个性的Agent充当合适的角色.基于共同的目标和相同的信息,Agent可能产生共同的意图,规划出共同的行为,使得MAS可以适用于动态、实时、有干扰、对抗的环境中.  相似文献   

9.
针对分布式多 Agent 系统(MAS)的动态不确定性、信息不完全性以及非信讯的多智能体协作特点,引入了 Agent 递减算法,并据 agent 行为预测的具体情况对其加以调整,而后结合提出的时空表控制方式,解决了不完全信息下的多 Agent 的非通信协作问题,并提高了协作效率.最后,以足球机器人 RoboCup 仿真比赛系统实际应用为例,验证了该方法的可行性和有效性.  相似文献   

10.
分布式仿真系统验证工具设计与开发   总被引:1,自引:0,他引:1  
为实现分布式仿真系统的自动验证,设计并开发了一个基于多Agent技术的验证工具.该工具采用形式化描述和校核方法完成多Agent系统的设计,利用Q学习算法实现多Agent之间的协调和协作,并使用面向对象知识表示方法表示了分布式仿真系统的验证知识,从而实现了统计验证、图灵测试和表面验证等任务.实际应用证明,该工具极大的提高了分布式仿真系统验证的自动化水平.  相似文献   

11.
车辆信息检测是车型识别在智慧交通领域中的首要任务。针对现有的车辆信息检测技术在检测速度、精度以及稳定性方面存在的问题,提出了基于YOLOv3的深度学习目标检测算法——YOLOv3-fass。该算法以DarkNet-53网络结构为基础,删减了部分残差结构,降低了卷积层的通道数,添加了1条下采样支路和3个尺度跳连结构,增加了一个检测尺度,并通过K-均值聚类与手动调节相结合的方法计算出12组锚框值。最后通过迁移学习机制对YOLOv3-fass算法进行微调。在自研的车辆数据集上,YOLOv3-fass算法与YOLOv3、YOLOv3-tiny、YOLOv3-spp算法以及具有ResNet50和DenseNet201经典网络结构的算法做了对比实验,结果表明YOLOv3-fass算法能够更精准、高效、稳定地检测到车辆信息。  相似文献   

12.
一种SVM增量学习算法   总被引:13,自引:6,他引:13  
分析了SVM理论中SV(支持向量)集的特点,给出一种SVM增量学习算法,通过在增量学习中使用SV集与训练样本集的分类等价性,使得新的增量训练无需在整个训练样本空间进行,理论分析和实验结果表明,该算法能然保证分类精度的同时有效地提高训练速度。  相似文献   

13.
一般和对策中,只考虑个体理性的多代理协作是一种无全局目标的协作.代理学习基于对手策略假设,不能保证假设的正确性.为此通过定义代理协作的集体目标,提出了一种基于多代理协商的代理强化学习算法.代理选择协商策略,并惩罚偏离该策略的代理来保证协商策略的执行.文中给出了学习收敛的条件及证明,并以实例加以分析.  相似文献   

14.
姚捃  郭志林  赵杰 《科学技术与工程》2022,22(22):9721-9727
在实际监控的边缘设备中利用TSN或者3DCNN网络很难实现实时的、相对准确的监控任务。提出一种结合了人体检测和人体属性分析的考场行为识别算法。相对于以提取时空特征作视频分类算法为主流思想的行为识别,利用视频帧以人体检测和人体属性分析结合的行为识别方法更加快速准确。方法借助了多标签学习、注意力机制和特征金字塔等策略来改进任务,同时利用迁移学习对本地采集的数据集进行再训练,实验结果表明达到了主流数据集的良好性能,并在考场环境具有高效性与实用性。  相似文献   

15.
21世纪是信息化的时代,信息化将渗透到各个领域,传统的教育模式已经不能适应社会发展的需求.远程教育是未来教育发展的重点.现代远程教育以计算机网络以及卫星数字通讯技术为支撑,具有时空自由、资源共享、系统开放、便于协作等优点.世界各国在发展现代远程教育时深刻认识到,学习资源的可共享性和系统的互操作性对于网络远程教育的实用性和经济性具有决定性意义.本论文结合我校实际情况提出发展远程教育的一套解决方案.涉及网络的规划、服务器的安全配置、数据库的安装测试等.对开展远程教育提出了一个大体的解决框架,从实际出发研究了我校发展远程教育的可行性.  相似文献   

16.
为了取得精确的图像分类效果,一方面需要提取大量的图像特征数据进行样本分析,另一方面大量的数据又造成了维数灾难.因此,为了解决信息全面与维数灾难的矛盾,引入了深度学习.深度学习利用分层结构处理复杂的高维数据,可以完成复杂函数的逼近,是一类具有多层非线性映射的学习算法,但深度学习模型优化困难且对隐层参数敏感.针对上述问题,将无监督算法引入深度学习,这种学习方法无须人工设计特征提取数据,训练过程中样本标签是未知的.实验表明,该算法在不影响图像分类效果的前提下,可以大大降低计算复杂度,具有一定的时效性.  相似文献   

17.
Web信息提取中多策略学习算法的研究   总被引:1,自引:1,他引:1  
将一种新的机器学习方法-多策略学习算法应用于Web信息提取领域,在原有的机械学习,统计学习和相关学习等三种机器学习法基础之上充分考虑各学习方法的利弊,将三者有机结合,使得结合后的新算法在提取Web信息时比结合前任一单一机器学习方法都更有效、更准确。  相似文献   

18.
随着高校科研项目的逐年增加和财政投入的不断增长,科研经费已经成为高校财务管理的重要内容.但在实际工作中,主要存在部门间管理相互脱节、核算办法不统一、管理手段落后、经费支出不合理、缺乏有效监督等问题.针对高校科研经费财务管理的现状和存在的主要问题,提出了加强部门间协作沟通、统一会计核算办法、构建信息管理系统、合理开支经费和完善监督检查制度等解决问题的发展对策.  相似文献   

19.
针对现有序列推荐算法易受数据稀疏影响以及对用户短期动态偏好建模不充分的问题,提出基于自监督学习的序列推荐算法。针对短期序列中的原始项目关系更易受到随机数据增强破坏的问题,对长短期序列使用不同的数据增强方法来构建更有效的自监督信号;利用对比式自监督学习框架对用户长期偏好和短期偏好进行多任务联合建模;针对现有自注意力机制无法建模序列中项目相对位置关系的问题,将自然语言处理领域中的解耦注意力机制引入到用户短期偏好学习过程中,充分捕获用户短期序列中项目的相对位置信息。实验结果证明了所提算法的有效性。  相似文献   

20.
近年来,基于孪生网络的目标跟踪算法由于在跟踪精度和跟踪效率之间能够实现良好的平衡而备受关注。通过对基于孪生网络的目标跟踪算法的文献进行归纳,对现有孪生网络目标跟踪算法进行了全面总结,对孪生网络的2个分支结构进行了讨论。首先,介绍了基于孪生网络目标跟踪的基本架构,重点分析了孪生网络中主干网络的优化,以及主干网络的目标特征提取问题。其次,对目标跟踪过程中的分类和回归2个任务展开讨论,将其分为有锚框和无锚框2大类来进行分析研究,通过实验对比,分析了算法的优缺点及其目标跟踪性能。最后,提出未来的研究重点:1)探索背景信息训练,实现场景中背景信息传播,充分利用背景信息实现目标定位。2)目标跟踪过程中,目标特征信息的更加丰富化和目标跟踪框的自适应变化。3)从帧与帧之间全局信息传播,到目标局部信息传播的研究,为准确定位跟踪目标提供支撑。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号