首页 | 本学科首页   官方微博 | 高级检索  
     

基于增强拓扑神经进化的等效并行机动态调度
作者姓名:陈亚绒  周升伟  管在林  岳磊
作者单位:1. 温州大学机电工程学院;2. 华中科技大学机械科学与工程学院;3. 广州大学机械与电气工程学院
基金项目:国家自然科学基金资助项目(51705370,51905196);
摘    要:针对工件动态到达、处理时间不确定且机器须要弹性预防维护的等效并行机调度问题,以平均流程时间最小化为目标,提出了基于强化学习的动态调度方法.将调度过程作为马尔可夫决策过程,通过定义状态空间、行为空间、奖励函数与适应度函数,提出基于增强拓扑神经进化(NEAT)算法的动态调度方法.设计三种规模问题的实例,将基于NEAT的方法与最短路径树(SPT)、先装先卸(FIFO)调度规则及基于深度Q网络(DQN)的方法进行比较,结果表明:基于NEAT的方法相比基于DQN的方法能够以更短的训练时间获得更优、更稳健的调度方案,相比SPT和FIFO调度规则能够获得更优的目标值,利用训练好的NEAT模型对随机生成的大规模问题实例的快速高质量求解结果表明,基于NEAT的调度方法具有更好的泛化性能.

关 键 词:等效并行机调度  预防维护  强化学习  增强拓扑神经进化  深度Q网络
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号