本技术介绍了一种通信领域内的节能调控技术,该技术融合了扩散模型与强化学习。该方法通过以下步骤实现:首先,步骤S1,构建模拟基站环境以模拟流量动态变化;其次,步骤S2,利用扩散模型结合基站节能调控。该技术旨在优化基站能耗,提升通信效率。
背景技术
截至2023年5月底,中国已累计建成5G基站284.4万个,移动物联网终端用户超过20.5亿。到2024年一季度,我国累计建成5G基站364.7万个,5G用户普及率突破60%。2019年,我国5G基站耗电量在全社会用电量的占比约为0.05%。然而,到2023年,5G基站耗电量预计将占社会用电量的1.3%,到2026年,5G基站耗电量更将上升至全社会用电量的2.1%。
为应对基站节能的需求,业界已经提出了多种解决方案以应对挑战。关键的节能技术涵盖了简化公共信号的设计、采用极简化的小区架构、实施小区的非连续传输/接收策略、引入基站的唤醒机制以及优化睡眠模式的管理等。然而,在现实操作环境中,对基站自适应地实施这些节能措施并非易事。强化学习被认为是解决这一问题的关键技术。
但当前还存在问题:变化的多模态环境特征会使强化学习的策略网络难以精确捕捉到环境的准确特征,进而影响决策。
近年来扩散模型在自然语言处理和计算机视觉等领域大放异彩可以很好地捕捉多模态分布。结合扩散模型与强化学习的方法在当前研究领域中同样备受瞩目。但是在线强化学习中的价值估计存在较高的噪声,这种噪声还会随着策略的调整而波动,这为训练扩散模型增加了额外的难度。
此外,由于基站控制通常涉及的是离散动作,目前基于扩散模型的强化学习方法并不适宜。
实现思路