首页 | 本学科首页   官方微博 | 高级检索  
     

鸽子强化学习过程中内部学习状态的动态建模研究
引用本文:师丽,陶梦妍,李志辉. 鸽子强化学习过程中内部学习状态的动态建模研究[J]. 科学技术与工程, 2017, 17(13)
作者姓名:师丽  陶梦妍  李志辉
作者单位:郑州大学电气工程学院,郑州大学电气工程学院,郑州大学电气工程学院
基金项目:国家自然科学基金项目(面上项目,重点项目,重大项目)
摘    要:经典Q-learning强化学习模型中学习率为一固定参数,无法有效反映认知学习的动态过程。提出了一种将学习速率表征为时变参数的Q-Learning强化学习模型,给出了利用近期历史行为数据估计阶段性学习速率的方法。为了评估验证该模型的性能,设计了条件刺激与操作行为奖励无关→相关→无关三个阶段动态试验范式,用以观察和分析鸽子在随机强化、固定强化,以及固定强化关系消退等不同条件下的学习行为变化过程,采用动物触屏行为系统完成了3只鸽子颜色刺激-啄屏抉择认知训练,利用训练过程中不同session的行为数据对动态学习率进行了最小二乘估计。分析结果表明:可以获得更小的行为预测误差,误差下降收敛的速度更快,同时学习率的动态变化过程可以有效的反映动物认知行为训练过程中的内在学习状态。

关 键 词:动态学习率 Q-Learning 鸽子 行为
收稿时间:2016-10-14
修稿时间:2016-10-14

Dynamic modeling of internal cognitive status of pigeon in the process of reinforcement learning
shili,Tao Mengyan and. Dynamic modeling of internal cognitive status of pigeon in the process of reinforcement learning[J]. Science Technology and Engineering, 2017, 17(13)
Authors:shili  Tao Mengyan and
Affiliation:School of Electrical Engineering, Zhengzhou University,School of Electrical Engineering, Zhengzhou University,
Abstract:
Keywords:dynamic learning rate q-learning pigeon behavior
本文献已被 CNKI 等数据库收录!
点击此处可从《科学技术与工程》浏览原始摘要信息
点击此处可从《科学技术与工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号