摘要: 为了解决全景视频服务中云服务器和边缘服务器的联合边缘缓存问题,优化边缘缓存机制以降低用户获取视频资源的时延,提出用DQN进行深度强化学习以生成视频资源缓存策略的方法。首先,以总节约时间为目标将问题建模成马尔可夫决策过程;其次,使用DQN算法进行训练,在迭代中获取最优缓存策略。仿真结果表明,DQN算法具有较高的收敛速度和最优的性能,且在约束条件改变时能主动变换调整边缘缓存策略使得算法性能稳定上升。
中图分类号:
杨树杰 方楚星 郝昊 蒋可. 一种基于DQN的全景视频边缘缓存优化方案[J]. 北京邮电大学学报, 2023, 46(5): 60-65.