期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

刘新华张旭堂金天国刘文剑《清华大学学报(自然科学版)》2008,48(10)

为了实现技术准备过程的集成与协同,将多代理技术和模糊综合评判技术引入到技术准备过程中来.在分析系统业务过程的基础上,建立了基于多Agent的技术准备集成系统框架,该框架由管理Agent、功能Agent和信息Agent构成;提出了由功能适配器、工作引擎、知识库和外部接口构成的Agent模型,并设计了各Agent的内部功能结构,为了解决Agent之间的协同问题,给出了Agent之间的协作模型,并在研究模糊综合评判方法的基础上,设计了Agent之间的冲突消解算法.最后,通过一个应用实例验证了系统的有效性. 相似文献

2.

动态环境下的多智能体机器人协作模型 总被引：2，自引：0，他引：2

朴松昊孙立宁钟秋波黄庆成《华中科技大学学报(自然科学版)》2008,36(Z1)

提出了在动态环境中,多Agent的一种协作模型,适用于环境信息不完备的复杂情况.将Agent的独立强化学习与BDI模型结合起来,使多Agent系统不但拥有强化学习的高度反应性和自适应性,而且拥有BDI的推理能力,使只使用数值分析而忽略推理环节的强化学习结合了逻辑推理方法.使用了Borlzman选取随机动作,并且采用了新的奖励函数和表示方法,减少了学习空间,提高了学习速度.仿真结果表明所提方法可行,能够满足多Agent系统的要求. 相似文献

3.

支持协同的工作流建模新方法

王静莲董相志柳岸《山东科学》2007,20(4):21-25

针对现有的工作流协同机制普遍存在缺乏自组织、自学习和自适应能力的瓶颈问题,基于电子公文处理的系列工作,研究了一种新的工作流建模方法。将多Agent理论引入到该领域,具体设计了四类Agent结构并探讨了其中关键模型(调控Agent)的实现机理。相似文献

4.

动态环境下多智能体协作学习方法的研究

王全武胡晓辉《科技咨询导报》2011,(9):253-254

将预测分析技术和强化学习技术有机结合,使多Agent系统中的各Agent,不仅具有了高度反应自适应性,而且拥有了高效而准确的预测分析能力;使Agent的行为更具有针对性,尽可能地减少错误,保证学习的正确方向,提高Agent间进行信息共享,融合单个Agent的Q值表.相当于相同情况下增加了学习次数,不仅尽可能地消除策略中的冗余动作,以高效的方式实现最终目标,而且提高多Agent系统执行效率和收敛速度及性能.本文提出了一种改进的多Agent间协作学习方法,适用于环境不完备的复杂情况.以追捕问题作为仿真实验.结果表明所提方法能够有效地促进多智能体系统中各Agent间协作学习能力. 相似文献

5.

基于GA-RL算法的多Agent电梯群控系统

张广明巩建鸣涂善东《华东理工大学学报(自然科学版)》2009,35(4)

针对电梯群控系统这一类复杂的派梯优化决策问题,应用多Agent的理论与技术,建立了系统强化学习模型.提出了一种基于GA算法的多Agent强化学习方法,给出了具体算法的一般描述.建立电梯群控调度系统的虚拟仿真环境,并与其他算法进行了对比研究.仿真结果表明:该方法在提高强化学习的效率和收敛速度,改善种群结构等方面收到了很好的求解效果,为电梯群控系统的优化调度决策提供了一种较好的途径. 相似文献

6.

基于多智能体混合协同交流模型的协同GIS研究与设计 总被引：3，自引：0，他引：3

李伟刘仁义刘南《上海交通大学学报》2005,39(8):1383-1388

讨论了协同GIS的发展状况以及所面临的问题，并引入了Agent技术，为解决协同地理信息系统（GIS）协同信息交互提供了有效的方法；基于多Agent技术提出了多Agent混合协同交流模型MAMCIM（multi-agent mix cooperative intercommunion model）和协同GIS-Agent模型，重点讨论了它们的体系结构、组成；结合协同地图编辑需求，给出了基于MAMCIM的协同编辑处理流程，借助于Corba分布式计算技术，构建了基于上述模型的原型系统，并对系统进行了测试。测试结果表明，系统达到了设计目标。相似文献

7.

多Agent系统的Q值强化学习算法

尚艳玲肖文雅《河南师范大学学报(自然科学版)》2013,41(2):158-160

对多Agent系统的Q值强化学习算法进行研究,将历史信息因素的影响添加到Q值学习中,提出了一个新的基于多Agent系统的Q值学习算法.该算法在保证多Agent系统利益达到相对最大化的同时,也有效降低了Agent之间的冲突率.最后,通过仿真测试验证了该算法的有效性. 相似文献

8.

协同环境下基于客户满意度的协商模型

梁爽于天彪苏莹莹王宛山《东北大学学报(自然科学版)》2009,30(1):129

针对网络化制造环境下产品设计的特点,分析了客户满意度在产品设计中的重要性.将客户满意度应用到协同设计环境下的协商机制中.按照协同设计环境下产品设计的要求建立了在产品协同设计过程中客户满意度的指标体系,并以此建立了满意度数学模型.采用多Agent技术,建立基于客户满意度的协商Agent模型并分析了协商过程.结合企业实际需求,利用BP神经网络对客户满意度的评估进行了训练和仿真,通过神经网络减少评价过程中的人为因素,提高了评价的可靠性.同时验证了基于BP神经网络的客户满意度协商模型的有效性. 相似文献

9.

基于多Agent的地方财政风险预算编制系统的设计 总被引：1，自引：0，他引：1

石为人蒋畅江彭世强康静《重庆大学学报(自然科学版)》2004,27(2):47-50

防范和化解财政风险,是各级政府十分关注的问题.针对地方财政风险,笔者提出对引起地方财政风险的政府负债按性质进行分类,构建4个负债Agent,并设置协同Agent和其他辅助Agent,组成多Agent系统;利用多个Agent的通讯与协作,编制地方财政风险预算.并构建了基于多Agent分布式计算体系结构的地方财政风险预算编制系统;研究了Agent的基本结构以及多Agent的协作机制. 相似文献

10.

基于信度分配函数的Agent强化学习算法

吴继伟萧蕴诗许维胜《同济大学学报(自然科学版)》2003,31(8):947-950

基于智能体 (Agent)系统强化学习原理和基于动态规划的Q -学习算法的基础上 ,提出了一种新的Agent强化学习算法 .该算法在Agent学习过程中不断调整Agent知识库的加权值 ,在强化学习的每个阶段 ,通过选取合适的信度分配函数来修正Agent强化学习动作的选取策略 .与标准的Q -学习方法相比 ,具有更加合理的物理结构 ,并且能保证算法收敛 .仿真实验说明该方法加快了标准Q -学习算法的收敛速度 ,具有较好的学习性能相似文献

11.

一种基于团队马尔可夫博弈的多agent协同强化学习算法

王长缨陈文伟姚莉《复旦学报(自然科学版)》2004,43(5):842-844

研究多agent系统的学习行为对于智能系统的适应性是至关重要的．针对一类追求系统得益最大化的协作团队的学习问题,基于马尔可夫博弈的思想,提出了一种新的多agent协同强化学习算法．协作团队中的每个agent通过观察协作相识者的历史行为,依照马尔可夫博弈模型预测其行为策略,采用适合的行为探索策略,进而得出最优的联合行为策略．实验对该算法进行了验证,结果表明该算法是有效的．相似文献

12.

NDSocTeam仿真机器人足球队的设计和实现

杨佩赵志宏陈兆乾《南京大学学报(自然科学版)》2003,39(5):451-458

机器人足球(RoboCup)是研究多agent系统的体系结构、多agent团队合作理论以及机器学习方法的理想测试平台。介绍了开发的仿真球队NDSocTeam系统的设计原理和实现技术。系统设计了以机器学习技术为核心的球员agent结构，并建立了一种分层学习以及多种学习技术相结合的机器学习系统．重点描述了NDSocTeam系统的总体结构、球员agent的结构以及机器学习的实现技术。相似文献

13.

协同事务Agent原型系统的设计与实现

莫倩刘书家《北京工商大学学报(自然科学版)》2004,22(6):39-42

介绍了一个采用Java语言实现的协同事务Agent原型系统CTAP.CTAP的功能是通过语法分析,实现用户按照协同事务处理语言语法描述的协同事务Agent,实现Agent间的事务协作.CTAP是一个将高级事务处理与Agent理论相结合的多Agent系统原型,在实现上具有体系结构无关性、可移植性和数据库透明性等特点. 相似文献

14.

一种基于意图跟踪和强化学习的agent模型 总被引：1，自引：0，他引：1

续爽贾云得《北京理工大学学报》2004,24(8):679-682

针对动态对抗的多agent系统(MAS)环境中agent行为前摄性较差的问题,提出了一种将意图跟踪和强化学习相结合的agent模型.该模型将对手信息和环境信息分开处理,在agent的BDI心智模型中引入了Q-学习机制应对环境变化;在强化学习的基础上注重对对手和对手团队的意图跟踪,改进Tambe的意图跟踪理论,针对特定对抗环境中的对手行为建立对手模型,跟踪对手和对手团队的意图,预测对手目标,以调整自身行为.实验证明,所提出的agent模型具有更强的自主性和适应性,在动态对抗系统中具有更强的生存能力. 相似文献

15.

一种基于D-S理论的多Agent合作决策机制

陈锋谭现虎王家捷方廷健《中国科学技术大学学报》2006,36(2):187-192

为了克服单个agent知识的局限性,提高系统决策的可靠性,提出了一种基于D-S理论的多agent合作决策机制,并对多agent合作决策进行了定义和形式化描述.多agent合作决策划分为学习和决策两个阶段,学习阶段反馈信息的引入,使各agent根据正确的训练案例和修正公式实现了冲突消解,降低了合成计算的复杂度,改进了Dragoni等人的工作,较投票机制和加权多数算法具有更高的可靠性,实验结果验证了这一结论. 相似文献

16.

Dynamic behavior modeling in multi-agent system by evolutionary programming

Jun Wei Zhengjun Pan Lishang Kang 《武汉大学学报:自然科学英文版》1996,1(3-4):651-657

In a multi-agent system, each agent must adapt itself to the environment and coordinate with other agents dynamically. To predict or cooperate with the behavior of other agents. An agent should dynamically establish and evolve the cooperative behavior model of itself. In this paper, we represent the behavior model of an agent as a finite state machine and propose a new method of dynamically evolving the behavior model of an agent by evolutionary programming. 相似文献

17.

Study on Multi-agent Systems with Colored Petri Nets

Shunguo Lan Li Jun 《科技信息》2008,(20)

The approach to model multi-agent systems with hierarchical colored Petri nets is introduced. In a multi-agent system, every agent is modeled with colored Petri net system, and the colored Petri net system of the multi-agent system is a hierarchical colored Petri net system, such that the agents planning deadlock detection and avoidance, can be analyzed with the Petri net system. 相似文献

18.

对称和非对称的启发式多Agent再励学习方法

张新良石纯一《清华大学学报(自然科学版)》2006,46(4):559-562

针对解决对传统的多A gen t再励学习算法中,A gen t只能独立学习、不能合作学习的问题和启发式算法中只考虑了单个A gen t而没有推广到多A gen t的情况,给出了对称和非对称环境下的基于启发式的多A gen t再励学习算法。该算法基于A gen t之间的通信来获取其它A gen t的历史信息,以及动作选择策略,结合启发式算法思想,达到A gen t在学习过程中的合作的目的,最终提高学习的效率。以2个A gen t的2个状态3个动作选择为例,表明该算法的收敛速度高于传统分布式再励学习算法的收敛速度。相似文献

19.

基于替代传导径迹的多智能体增强式学习

杨玉君程君实陈佳品《上海交通大学学报》2003,37(8):1271-1274

提出一种多智能体增强式学习方法，每个智能体在学习过程中将其他智能体和环境区分开来，并且通过维持其他智能体的替代传导径迹来预测它们的行为，从而也确定了自身的行为。该算法不需要知道其他智能体的Q函数结构和奖赏函数结构，适用条件宽松。仿真结果证明了所提出学习算法的有效性，而且相对于集中式Q学习效率有很大的提高。相似文献

20.

基于对话的多Agent协作交互模型 总被引：1，自引：0，他引：1

安毅生李人厚《西安交通大学学报》2005,39(12):1344-1348

针对传统协作设计过程中任务分解、任务分配的随意性和盲目性,提出了一种基于对话的多智能体协作交互模型.初始承担者首先通过信息搜索对话,依次询问设计辅助智能体的专业领域及参与完成设计任务的能力、愿望和机会,以确定其能否作为潜在的协作组成员,然后选用劝说对话,依次劝说潜在协作组成员把实现设计任务作为其意图,最后再次以劝说对话的形式,使潜在协作组成员意识到组内其他成员也都拥有承担设计任务的独立意图和相关意图,以联合信念的形式予以确认,并广播到每个成员.给出了一个达成的对话过程,总结了对话模式的效用与代价公式.实际应用表明,所提对话交互模型在没有固定消息顺序的情况下,可限制每个点上的可能响应,同时其Agent可以表达特定言语行为的态度,并产生这一态度的逻辑推理过程. 相似文献