优化深度确定性策略梯度的水下任务卸载技术

123技术园

首页 / 技术内容

2025-01-16 11:04

No.1329405947495587840

技术概要

PDF全文

本技术介绍了一种优化的深度确定性策略梯度算法，用于水下环境中的计算任务卸载。该方法首先设定任务卸载问题的状态空间，并利用卸载模式和数量矩阵引入噪声以构建动作空间。通过任务卸载策略，实现了计算效率和能源消耗的优化。

背景技术

海洋占地球表面积71%以上，搭建海洋物联网（Ocean of things，OoT）对海洋进行立体观测越来越重要，OoT的组网架构一般包含海面-水下两层，海面层为浮标、水下层为各类传感器节点，传感器节点将采集的数据传输给浮标节点，再由浮标节点处理数据后发送到岸上监测中心。随着OoT的发展，OoT的覆盖区域越来越大，从近海延伸至远洋；同时网络中传感器节点的计算业务，如数据分析、运行网络协议等激增，传感器节点处理这些计算业务耗费大量能量，传统OoT的海面-水下两层组网架构已经不能满足需求，利用卫星节点搭建太空-海面-水下三层新型OoT架构，通过移动边缘计算（Mobile edge computing，MEC）任务卸载技术，将水下传感器节点数据分析、运行网络协议产生的计算任务卸载到浮标或卫星边缘服务器上进行处理，成为研究热点。使用传统的强化学习算法解决计算任务卸载问题，是目前常见的方法，在此类方法中强化学习模型可部署在浮标节点上进行训练，训练完成后将计算任务卸载策略下发给浮标通信范围内的传感器节点，传感器节点可以将自身计算任务根据卸载策略卸载到相关边缘服务器。然而，水下计算任务卸载问题的动作空间不能表示为简单的二值问题，需要继续分解；且在强化学习模型的奖励函数设计中没有考虑能耗的影响，容易导致计算任务卸载能耗高。需要注意的是，由于卫星节点和浮标节点通常可配备太阳能电池板，利用太阳能充电；而水下传感器节点在现有条件下通常无法在水下直接补充能量，在工作中需尽可能节省功耗以维持更长的工作生命周期。因此在执行水下传感器任务卸载时需要尽量减少能耗开销，具体包括本地计算能耗、任务发送到浮标节点和接收返回结果的能耗；当任务需要卸载时，水下传感器节点将数据卸载给浮标节点，由浮标节点进行任务处理并返回结果；如果浮标节点业务繁忙，无法进行处理，则将会计算任务进一步任务卸载到卫星节点进行处理。申请人同济大学在其申请专利文献“一种基于多智能体强化学习的边缘计算协同任务卸载方法”（申请日：2024年5月30日，申请号：202410687523.1，申请公布号：CN118585263 A，该申请的内容仍然可以被引用）中公开了一种基于多智能体强化学习的边缘计算协同任务卸载方法。该边缘计算协同任务卸载方法存在以下的不足：其计算任务卸载问题的动作空间表示为简单的0或1问题，即二值问题，无法准确描述计算任务卸载的动作；且奖励函数的设计中没有考虑能耗的影响，导致计算任务卸载的能耗偏高。使用深度确定性策略梯度（Deep Deterministic Policy Gradient，DDPG）算法解决计算任务卸载问题，是降低MEC系统中任务卸载能耗的有效方法，申请人南京理工大学在其申请专利文献“基于深度强化学习的卫星边缘计算任务卸载及资源分配方法”（申请日：2024年5月24日，申请号：202410655864.0，申请公布号：CN118250750A，该申请的内容仍然可以被引用）中公开了一种基于深度强化学习的卫星边缘计算任务卸载及资源分配方法。该卫星边缘计算任务卸载及资源分配方法存在以下的不足：其所用的深度强化学习为DDPG算法，使用DDPG算法进行计算任务卸载，DDPG算法在训练时更新幅度使用固定值，导致当计算任务卸载量较大时，算法收敛速度较慢，长时间训练进一步加剧了能耗问题。综上所述，传统基于强化学习的方法用于OoT时存在计算任务卸载能耗高、算法收敛速度慢的问题。

实现思路

阅读余下40%

技术概要为部分技术内容，查看PDF获取完整资料

该技术已申请专利，如用于商业用途，请联系技术所有人！

技术研发人员：

李文峰刘帅张慧杰赵康僆

技术所属：南京大学

相关技术

一种均衡成本与检测精度的蓝牙信标传感器布设优化方法  一种均衡成本与检测精度的蓝牙信标传感器布设优化方法 
 本发明公开了一种均衡成本与检测精度的蓝牙信标传感器布设优化方法:1)在真实环境中采集RSSI数据并进行分析和参数拟合，得到RSSI‑距离关系模型；2)设计信标的布设方式并分析其对定位精度的影响，考虑成本与定位精度，对信标布设方式进行优化建模。本发明可以有效地建立一种考虑成本和定位精度因素的蓝牙信标传感器布设方式优化模型，为基于蓝牙信标传感器的定位方法的实施提供指导，从而能根据实际环境、成本预算、精度要求等条件，优选出最合适的信标布设方式。
一种基于深度强化学习的RIS辅助MU-MISO通信系统智能波束成形方法  一种基于深度强化学习的RIS辅助MU-MISO通信系统智能波束成形方法 
 本发明公开了一种基于RIS辅助的MU‑MISO通信系统的智能波束成形设计方法，提出了一种基于CSI的DDPG模型，用于联合优化基站的主动发射波束成形矩阵和RIS的反射系数向量，利用强化学习技术，通过与环境的交互，自适应地优化通信系统的波束成形参数，从而在实际信道条件下实现最优传输性能。本发明提出的算法在不同发射功率和RIS反射单元数量下均表现出良好的鲁棒性和收敛性，显著提高了MU‑MISO通信系统的传输速率。此外，该算法能够有效应对快速变化的信道环境，为RIS在实际无线通信系统中的应用提供了重要支持。本发明通过将强化学习与波束成形技术相结合，提出了一种高效的联合优化方法，为未来6G通信系统的发展提供了新思路，具有重要的应用前景和实际价值。
相干光OFDM系统中一种投影直方图抑制相位噪声的方法  相干光OFDM系统中一种投影直方图抑制相位噪声的方法 
 本发明涉及相干光OFDM系统中一种投影直方图抑制相位噪声的方法。该方法先对循环前缀进行线性处理，以降低载波间干扰(ICI)的功率，对相位噪声进行初步的抑制。然后利用少量导频得到相位噪声的粗略估计后，使用伪导频辅助进一步对相位噪声进行抑制，最后两次利用投影直方图对相位噪声进行补偿，以此来提高时间分辨率和抑制精度。仿真结果表明:该算法在16阶正交振幅调制(16QAM)下，激光线宽为100kHz时，较传统投影直方图的补偿效果有所提高，且有效提高了频谱利用率。
一种基于空间谱估计和地图匹配的一体化定位方法  一种基于空间谱估计和地图匹配的一体化定位方法 
 本发明公开了一种基于空间谱估计和地图匹配的一体化定位方法，通过提供一种基于空间谱估计和地图匹配的两阶段通信感知一体化定位方法，构建一个基于正交频分复用的通感一体蜂窝系统模型，在该系统里的设备都可以同时发送和接收通信信号波形以此完成单目标设备定位。特别是，考虑了正交频分复用方案用于通信信号传输，因此结果与5G及以后的蜂窝网络兼容。在这种设置下提出了两阶段定位框架。在第一阶段，利用遗传算法的并行性、全局寻优性和简单性，对传统的多信号分类算法进行了改进，最终实现了目标的距离、到达方向(AOA)和到达俯仰角(EOA)的联合估计。
基于STL分解的多尺度混合基站流量预测系统  基于STL分解的多尺度混合基站流量预测系统 
 基于STL分解的多尺度混合基站流量预测系统，包括如下模块:多尺度时间分解模块：该模块的功能是将基站流量数据进行多尺度分解；基于STL的时间混合模块：该模块的功能是将多尺度时间分解模块所得到高维空间的多尺度子序列进行STL分解，分解为季节项、趋势项、残差项三个部分，并通过不同的采样方法对时间序列进行建模；未来多预测混合模块：该模块的功能是整合不同时间尺度的预测结果，通过动态权重调整，计算最终预测结果；本发明系统通过多尺度时间分解技术，能够在大规模通信网络环境下，有效提升预测精度、实时性和计算效率。
灾后无人机通感系统的任务调度与资源分配方法及装置  灾后无人机通感系统的任务调度与资源分配方法及装置 
 本发明涉及通信技术领域，特别涉及灾后无人机通感系统的任务调度与资源分配方法及装置。方法包括:无人机补充失效的基站，对潜在的感知目标进行监测；将通信惩罚指数和感知惩罚指数作为在无人机能量约束下的优化目标；建立联合任务调度和资源分配模型，最小化通信性能指标和感知性能指标的加权和；将优化问题重新表述为马尔可夫决策过程；构建软演员‑评论家算法SAC更新MDP，将迁移学习应用于软演员‑评论家算法SAC，当基站可用性发生变化时，将已训练模型的参数转移到更新后的MDP中。实验结果表明，SAC在通信和感知性能以及收敛速度上均优于基线算法。基于迁移学习的SAC在基站可用性突然变化时表现出更快的收敛速度和更好的鲁棒性。
一种基于深度学习的室内可见光融合定位方法  一种基于深度学习的室内可见光融合定位方法 
 本发明公开了一种基于深度学习的室内可见光融合定位方法，包括以下步骤；步骤1:采集不同位置下可见光的AoA信息和UWB的距离信息数据，并进行数据预处理，再将其变换为二维矩阵格式，便于网络输入；步骤2：构建网络模型，用于提取预处理后数据的特征，并进行特征融合，对融合后的特征进行处理，输出获取数据的定位连续坐标值；步骤3：训练网络模型，使用包含和不包含AoA数据的样本，确保网络模型在仅有UWB数据的情况下也能进行有效的学习；本发明利用UWB信号的穿透性来弥补可见光易被遮挡的不足，可在不同环境下保持高精度和稳定性。
一种蜂窝通信流量预测方法、系统及程序产品  一种蜂窝通信流量预测方法、系统及程序产品 
 本发明属于蜂窝通信技术领域，具体公开了一种蜂窝通信流量预测方法、系统及程序产品，利用目标网络区域内各网络节点在各连续历史时间点的蜂窝通信流量测量数据，构建历史蜂窝通信流量序列，再将历史蜂窝通信流量序列输入动态时空图卷积网络中进行分析，得到相应的蜂窝通信流量预测结果。本发明通过相应的动态时空图卷积网络对目标区域进行历史蜂窝通信流量的时空特性分析，进而可以实现对区域后续时间段蜂窝通信流量的精准预测，且经过地面真实蜂窝流量信息评估，并被证明具有先进效果，可以解决现有蜂窝通信流量方法效率低、精度低的问题。
基于SGX的面向无线医疗传感器网络的可搜索加密方法  基于SGX的面向无线医疗传感器网络的可搜索加密方法 
 本发明属于密态数据搜索技术领域，涉及基于SGX的面向无线医疗传感器网络的可搜索加密方法，包括:DO生成密钥集合SK和加密索引树I上传至SGX代理服务器；SGX代理服务器生成验证标签σ＆lt;subgt;I＆lt;/subgt;，并将其与I上传至云服务器；DU生成搜索陷门TD发送给SGX代理服务器；SGX代理服务器生成验证陷门σ＆lt;subgt;TD＆lt;/subgt;，并将其与TD发送至云服务器；云服务器根据TD在I上进行搜索，得到搜索结果，生成验证证明σ＆lt;subgt;s＆lt;/subgt;，并将其与搜索结果发送给SGX代理服务器以验证搜索结果，若验证通过，则将搜索结果发送给DU，DU接收并解密；本发明生成验证标签σ＆lt;subgt;I＆lt;/subgt;和验证陷门σ＆lt;subgt;TD＆lt;/subgt;，根据σ＆lt;subgt;I＆lt;/subgt;和σ＆lt;subgt;TD＆lt;/subgt;生成验证证明σ＆lt;subgt;s＆lt;/subgt;，并通过σ＆lt;subgt;s＆lt;/subgt;验证搜索结果，实现了搜索结果的可验证且验证效率比较好。
一种水下无线光通信的湍流模型及通信系统性能计算方法  一种水下无线光通信的湍流模型及通信系统性能计算方法 
 本发明公开了一种水下无线光通信的湍流模型及通信系统性能计算方法，考虑海洋湍流条件下建立新的湍流统计分布模型，并结合模型参数，得到该模型的闪烁指数的表达式，并利用Meijer‑G函数和Fox‑H函数得到该模型条件下的中断概率和误码率的闭式表达式，进而可以研究不同场景参数下对系统传输性能的影响。本发明相比于现有的湍流模型，更加接近海洋的复杂湍流环境，尤其是在双峰分布的复杂湍流场景下，可以更好地实现对真实海洋环境的模拟研究。

技术分类

电信、广播电视和卫星传输服务电信、广播电视和卫星传输服务

互联网软件服务互联网软件服务

集成电路设计集成电路设计

信息集成数字服务信息集成数字服务

电气机械制造电气机械制造

计算机、通信、电子设备制造计算机、通信、电子设备制造

医药制造、生物基材料医药制造、生物基材料

石油煤矿化学用品加工石油煤矿化学用品加工

化学原料制品加工化学原料制品加工

非金属矿物加工非金属矿物加工

金属制品加工金属制品加工

专用设备制造专用设备制造

通用设备制造通用设备制造

通用零部件制造通用零部件制造

汽车制造业汽车制造业

铁路、船舶、航天设备制造铁路、船舶、航天设备制造

电力、热力生产和供应电力、热力生产和供应

燃气生产和供应燃气生产和供应

水生产和供应水生产和供应

房屋建筑、土木工程房屋建筑、土木工程

交通运输、仓储和邮政交通运输、仓储和邮政

农、林、牧、渔业农、林、牧、渔业

采矿业采矿业

农副、食品加工农副、食品加工

烟草、酒水加工烟草、酒水加工

纺织皮具居家制品纺织皮具居家制品

文教体娱加工文教体娱加工