本技术公开了一种星地融合网络调度方法、装置、介质和设备,涉及星地融合网络技术领域。应用于包括多个地面用户、中央服务器和多个卫星的星地融合网络;该地面用户以卫星作为卸载单元卸载模型参数至中央服务器,每个地面用户本地执行通信优化,先确定本地计算时间表示,对各地面用户的本地模型进行量化模型分析,确定每个本地模型的权重参数对应的量化比特数目以确定本地量化模型参数,再确定每个地面用户的传输时间表示,以确定联邦图学习的总时延,之后构建联邦图优化模型并求解,使各地面用户与各卫星在求解得到的各优化变量对应工作参数下进行联邦图学习以进行网络调度。本发明降低了传输时延且能够得到更好的卸载决策。
背景技术
传统地面蜂窝网络在远程区域覆盖范围较低、计算容量有限且鲁棒等级较低,基于此,星地融合网络被提出并应用,星地融合网络可为地面用户提供普适连接、全局覆盖和灵活的部署能力,这将优化网络通信资源并实现通信任务调度。
星地融合网络架构可通过融合地面通信和卫星通信为大量的地面用户提供全局覆盖、巨大的传输带宽和强大的中继转发功能。然而,现有星地融合网络节点动态复杂,对应的联邦有向图结构存在显著特征。首先,每个图节点缺乏固定顺序和参考坐标;其次,星地融合网络中的实体数据具有多模态和复杂特征,难以直接应用图神经网络方法来优化时延。
现有技术中,有研究通过贪婪量化进行资源分配,对于贪婪量化策略,每个地面用户根据计算机字节数目来平均分配量化比特数目,还有研究通过深度确定性策略梯度进行资源分配,深度确定性策略梯度包括两个传统的Actor神经网络和Critic神经网络,该方案将通过Actor神经网络来优化CPU周期频率、传输带宽和量化比特数目。同时,Critic神经网络将帮助Actor网络来调整模型参数。
然而,贪婪量化策略由于为每个用户平均分配量化比特数目,这使得难以找到每个用户的优选的量化比特数目;而深度确定性策略梯度方案由于收集了大量的全局状态信息,加大了神经网络训练时间,造成巨大的传输时延。
实现思路