共查询到20条相似文献,搜索用时 109 毫秒
1.
将预测分析技术和强化学习技术有机结合,使多Agent系统中的各Agent,不仅具有了高度反应自适应性,而且拥有了高效而准确的预测分析能力;使Agent的行为更具有针对性,尽可能地减少错误,保证学习的正确方向,提高Agent间进行信息共享,融合单个Agent的Q值表.相当于相同情况下增加了学习次数,不仅尽可能地消除策略中的冗余动作,以高效的方式实现最终目标,而且提高多Agent系统执行效率和收敛速度及性能.本文提出了一种改进的多Agent间协作学习方法,适用于环境不完备的复杂情况.以追捕问题作为仿真实验.结果表明所提方法能够有效地促进多智能体系统中各Agent间协作学习能力. 相似文献
2.
基于历史信息和时间约束的多Agent协商模型 总被引:1,自引:1,他引:0
协商是多Agent系统(Multi-Agent Systems:MAS)实现协调、协作和冲突消解的关键环节.如何在不完全信息的情况下构造有效的协商模型来提高Agent的协商能力,是多Agent系统研究中占有重要地位的问题之一.通过考虑历史信息和时间约束的情况下,讨论了多Agent多问题的协商类型,提出了基于历史信息和时间约束的协商模型(HTANM)和协商算法,为多Agent能进行自动协商奠定了一定的基础. 相似文献
3.
对多Agent系统的Q值强化学习算法进行研究,将历史信息因素的影响添加到Q值学习中,提出了一个新的基于多Agent系统的Q值学习算法.该算法在保证多Agent系统利益达到相对最大化的同时,也有效降低了Agent之间的冲突率.最后,通过仿真测试验证了该算法的有效性. 相似文献
4.
在开放、动态、具有自适应性和自治性的多Agent系统(MAS)中,协商是多Agent系统实现协调、协作和解决冲突的关键.博弈论是使用严谨的数学模型研究冲突条件下最优决策问题的理论,本文以此为数学工具,基于对时间的限制,结合协商的历史知识,考虑各协商者在拥有不完全信息的情况下,提出了基于博弈论的多Agent协商模型(GTMANM),并给出了协商策略求解的算法描述,用以来解决分布式环境下不完全信息的多人协商决策问题,以获得最大的期望收益,为以后把博弈论中其他更复杂的博弈思想引入到多Agent协商中来奠定了基础. 相似文献
5.
基于智能体 (Agent)系统强化学习原理和基于动态规划的Q -学习算法的基础上 ,提出了一种新的Agent强化学习算法 .该算法在Agent学习过程中不断调整Agent知识库的加权值 ,在强化学习的每个阶段 ,通过选取合适的信度分配函数来修正Agent强化学习动作的选取策略 .与标准的Q -学习方法相比 ,具有更加合理的物理结构 ,并且能保证算法收敛 .仿真实验说明该方法加快了标准Q -学习算法的收敛速度 ,具有较好的学习性能 相似文献
6.
7.
智能仿真支撑环境H-MAS 总被引:1,自引:0,他引:1
引入分布式人工智能中多Agent的概念,将HLA仿真技术框架和多Agent技术相结合性,提出了一种具有智能特性的H-MAS仿真支撑,在此环境下充分利用Agent所具备的驻留性、自主性,反应性,协作性和连续性等诸多特性,实现了一个通用的Agent仿真对象模型,并构造了一个由Agent控制器和KQML语言处理器组成的通信对象,用以完成Agent间的互操作,最后阐述了H-MAS系统的工作流程,实验证明,H-MAS不仅保留了HLA的全部服务功能,而且具有较强的智能化处理能力,是建模与仿较为理想的智能化实验平台。 相似文献
8.
将个性行为绑定到信息Agent上,提出了一种基于个性的协同强化学习算法,让不同个性的Agent充当合适的角色.基于共同的目标和相同的信息,Agent可能产生共同的意图,规划出共同的行为,使得MAS可以适用于动态、实时、有干扰、对抗的环境中. 相似文献
9.
10.
分布式仿真系统验证工具设计与开发 总被引:1,自引:0,他引:1
为实现分布式仿真系统的自动验证,设计并开发了一个基于多Agent技术的验证工具.该工具采用形式化描述和校核方法完成多Agent系统的设计,利用Q学习算法实现多Agent之间的协调和协作,并使用面向对象知识表示方法表示了分布式仿真系统的验证知识,从而实现了统计验证、图灵测试和表面验证等任务.实际应用证明,该工具极大的提高了分布式仿真系统验证的自动化水平. 相似文献
11.
车辆信息检测是车型识别在智慧交通领域中的首要任务。针对现有的车辆信息检测技术在检测速度、精度以及稳定性方面存在的问题,提出了基于YOLOv3的深度学习目标检测算法——YOLOv3-fass。该算法以DarkNet-53网络结构为基础,删减了部分残差结构,降低了卷积层的通道数,添加了1条下采样支路和3个尺度跳连结构,增加了一个检测尺度,并通过K-均值聚类与手动调节相结合的方法计算出12组锚框值。最后通过迁移学习机制对YOLOv3-fass算法进行微调。在自研的车辆数据集上,YOLOv3-fass算法与YOLOv3、YOLOv3-tiny、YOLOv3-spp算法以及具有ResNet50和DenseNet201经典网络结构的算法做了对比实验,结果表明YOLOv3-fass算法能够更精准、高效、稳定地检测到车辆信息。 相似文献
12.
一种SVM增量学习算法 总被引:13,自引:6,他引:13
分析了SVM理论中SV(支持向量)集的特点,给出一种SVM增量学习算法,通过在增量学习中使用SV集与训练样本集的分类等价性,使得新的增量训练无需在整个训练样本空间进行,理论分析和实验结果表明,该算法能然保证分类精度的同时有效地提高训练速度。 相似文献
13.
一般和对策中,只考虑个体理性的多代理协作是一种无全局目标的协作.代理学习基于对手策略假设,不能保证假设的正确性.为此通过定义代理协作的集体目标,提出了一种基于多代理协商的代理强化学习算法.代理选择协商策略,并惩罚偏离该策略的代理来保证协商策略的执行.文中给出了学习收敛的条件及证明,并以实例加以分析. 相似文献
14.
15.
21世纪是信息化的时代,信息化将渗透到各个领域,传统的教育模式已经不能适应社会发展的需求.远程教育是未来教育发展的重点.现代远程教育以计算机网络以及卫星数字通讯技术为支撑,具有时空自由、资源共享、系统开放、便于协作等优点.世界各国在发展现代远程教育时深刻认识到,学习资源的可共享性和系统的互操作性对于网络远程教育的实用性和经济性具有决定性意义.本论文结合我校实际情况提出发展远程教育的一套解决方案.涉及网络的规划、服务器的安全配置、数据库的安装测试等.对开展远程教育提出了一个大体的解决框架,从实际出发研究了我校发展远程教育的可行性. 相似文献
16.
17.
Web信息提取中多策略学习算法的研究 总被引:1,自引:1,他引:1
将一种新的机器学习方法-多策略学习算法应用于Web信息提取领域,在原有的机械学习,统计学习和相关学习等三种机器学习法基础之上充分考虑各学习方法的利弊,将三者有机结合,使得结合后的新算法在提取Web信息时比结合前任一单一机器学习方法都更有效、更准确。 相似文献
18.
随着高校科研项目的逐年增加和财政投入的不断增长,科研经费已经成为高校财务管理的重要内容.但在实际工作中,主要存在部门间管理相互脱节、核算办法不统一、管理手段落后、经费支出不合理、缺乏有效监督等问题.针对高校科研经费财务管理的现状和存在的主要问题,提出了加强部门间协作沟通、统一会计核算办法、构建信息管理系统、合理开支经费和完善监督检查制度等解决问题的发展对策. 相似文献
19.
针对现有序列推荐算法易受数据稀疏影响以及对用户短期动态偏好建模不充分的问题,提出基于自监督学习的序列推荐算法。针对短期序列中的原始项目关系更易受到随机数据增强破坏的问题,对长短期序列使用不同的数据增强方法来构建更有效的自监督信号;利用对比式自监督学习框架对用户长期偏好和短期偏好进行多任务联合建模;针对现有自注意力机制无法建模序列中项目相对位置关系的问题,将自然语言处理领域中的解耦注意力机制引入到用户短期偏好学习过程中,充分捕获用户短期序列中项目的相对位置信息。实验结果证明了所提算法的有效性。 相似文献
20.
近年来,基于孪生网络的目标跟踪算法由于在跟踪精度和跟踪效率之间能够实现良好的平衡而备受关注。通过对基于孪生网络的目标跟踪算法的文献进行归纳,对现有孪生网络目标跟踪算法进行了全面总结,对孪生网络的2个分支结构进行了讨论。首先,介绍了基于孪生网络目标跟踪的基本架构,重点分析了孪生网络中主干网络的优化,以及主干网络的目标特征提取问题。其次,对目标跟踪过程中的分类和回归2个任务展开讨论,将其分为有锚框和无锚框2大类来进行分析研究,通过实验对比,分析了算法的优缺点及其目标跟踪性能。最后,提出未来的研究重点:1)探索背景信息训练,实现场景中背景信息传播,充分利用背景信息实现目标定位。2)目标跟踪过程中,目标特征信息的更加丰富化和目标跟踪框的自适应变化。3)从帧与帧之间全局信息传播,到目标局部信息传播的研究,为准确定位跟踪目标提供支撑。 相似文献