结合先验知识的深度Q神经网络算法研究期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

结合先验知识的深度Q神经网络算法研究

引用本文：	褚伟,茹琦,任明仑.结合先验知识的深度Q神经网络算法研究[J].合肥工业大学学报(自然科学版),2019,42(7).

作者姓名：	褚伟茹琦任明仑

作者单位：	合肥工业大学过程优化与智能决策教育部重点实验室,安徽合肥 230009;合肥工业大学管理学院,安徽合肥 230009;合肥工业大学管理学院,安徽合肥,230009

摘要：	深度Q神经网络(deep Q-network,DQN)算法在训练初期,由于动作选择随机性强,导致算法的训练时间过长。针对该问题,文章提出一种结合先验知识的深度Q神经网络(priori knowledge-DQN,PK-DQN)算法,将先验知识定义为特征状态与最优动作的映射,根据先验知识对动作选择过程的影响程度,将先验知识引入DQN算法,优化DQN算法的动作选择规则,降低其在探索过程中的动作选择随机性,并使用赛车游戏对算法进行训练。实验结果表明,PK-DQN算法能够更快收敛,有较高的学习效率,算法训练时长明显缩短。
关键词：	深度学习强化学习深度Q神经网络(DQN) 先验知识
本文献已被 CNKI 万方数据等数据库收录！