基于PS-PDDPG算法的网络路由优化研究 |
| |
引用本文: | 陆燕,杨秋芬.基于PS-PDDPG算法的网络路由优化研究[J].科技资讯,2023(3):10-13. |
| |
作者姓名: | 陆燕 杨秋芬 |
| |
作者单位: | 湖南开放大学 |
| |
基金项目: | 湖南省教育厅科学研究项目“基于Actor-Critic框架的DDPG算法优化研究”(项目编号:21C1186);;湖南省自然科学基金项目“基于AdaBoost的哈欠检测算法研究”(项目编号:2021JJ60038); |
| |
摘 要: | 当前基于深度强化学习算法实现网络路由优化主要面临算法的难以收敛和可扩展性差两个问题。该文在深度强化学习PDDPG算法的基础上,提出了动态权重策略,设置了共享经验回放池,融合共享参数更新了公式,并搭建不同规模的网络实验环境,将深度强化学习优化算法PS-PDDPG应用到网络路由优化中。结果显示,PS-PDDPG算法在不同网络负载均衡环境下,它的网络延时较短且稳定,说明PS-PDDGP算法的收敛速度和可扩展性得到了提升。
|
关 键 词: | PDDPG算法 PS-PDDPG算法 网络路由 深度强化学习 |
|
|