首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于强化学习的多机器人合作行为获取
引用本文:李冬梅,陈卫东,席裕庚.基于强化学习的多机器人合作行为获取[J].上海交通大学学报,2005,39(8):1331-1335.
作者姓名:李冬梅  陈卫东  席裕庚
作者单位:上海交通大学,自动化系,上海,200030;上海交通大学,自动化系,上海,200030;上海交通大学,自动化系,上海,200030
基金项目:国家自然科学基金资助项目(60105005)
摘    要:研究了基于强化学习的多机器人学习社会合作行为的问题。通过定义的分配布尔矩阵,对参与任务者进行奖励回报,并综合基础行为,生成状态到行为的新的映射,形成高级的群体合作行为,使得团队作为一个整体受益。讨论了学习社会行为的可行性和必要性,并采用强化学习方法,给出了多机器人传接合作搬运的详细算法实现。

关 键 词:强化学习  多机器人  传接合作  社会行为
文章编号:1006-2467(2005)08-1331-05
收稿时间:2004-09-13
修稿时间:2004年9月13日

Multi-Robot Cooperative Behavior Generation Based on Reinforcement Learning
LI Dong-mei,CHEN Wei-dong,XI Yu-geng.Multi-Robot Cooperative Behavior Generation Based on Reinforcement Learning[J].Journal of Shanghai Jiaotong University,2005,39(8):1331-1335.
Authors:LI Dong-mei  CHEN Wei-dong  XI Yu-geng
Abstract:Learning social cooperative behavior in multi-robot was introduced, which assigns reinforcement by defining a boolean matrix, to agents if they have ever participated the accomplished task, and synthesizes basic behaviors to generate a new mapping from states to behaviors, and forms higher-level group cooperation, which will benefit the group as a whole. The possibility and necessity of learning social behavior were discussed, and applying reinforcement learning and the above idea to multi-agent's learning relay cooperation in convey.
Keywords:reinforcement learning  multi-robot  relay cooperation  social behavior
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号