摘要: 为了解决动态时变的无人机(Unmanned Aerial Vehicle, UAV)网络环境下,智能终端设备有限的计算和存储资源不能满足资源密集型任务需求,以及高传输时延和低可靠连接的问题,本文使用数字孪生技术在地面基站(Base Station, BS)构建无人机、智能终端以及无线网络环境的孪生网络模型,以对无人机网络运行状态进行模拟和仿真。进而,基于构建的孪生网络模型设计智能终端设备计算任务卸载机制。在满足智能终端设备计算任务最大容忍延迟的条件下,智能终端设备选择将计算任务全部卸载到无人机,或者在本地进行计算。然后,将计算卸载问题建模为马尔科夫决策过程,建立联合无人机悬停点、计算任务卸载决策、无人机计算资源分配的自适应资源优化模型,实现最大化无人机效用函数的目标。考虑孪生网络模型与真实无人机网络的虚实映射误差,提出近端策略优化算法(Proximal Policy Optimization,PPO),求解自适应资源优化模型。仿真结果表明,与已有方案对比,所提算法可以有效提高无人机的效用。同时,在适应虚实映射误差方面优于传统深度强化学习算法。
中图分类号: