本技术介绍了一种利用碳流理论及深度强化学习技术对多能系统进行优化调度的新方法。该方法通过碳排放流理论对多能系统的动态优化问题进行数学建模,并构建了优化调度的目标函数。
背景技术
多能系统具备协调互补的能力,是实现“双碳”目标的重要技术路径。多能系统是指在规划、建设和运行等阶段,通过对电、气、热等多种能源的生产、输送、转换和消费等环节进行协调与优化,形成的多能源一体化利用系统,包含能源供应单元、转换单元、存储单元和多元负荷。目前,针对多能系统的运行优化已有诸多研究,旨在实现电、热侧负荷的快速供需平衡。然而,缺乏合理的控制指令会显著降低多能系统的经济性与稳定性。因此,许多学者对多能系统的优化调度进行了深入研究,目标是实现最佳性能,降低成本并减少碳排放。此外,多能系统的优化控制面临多种不确定因素,用户负荷的随机性及可再生能源出力的波动性对系统运行优化造成重大影响,使得多种能源的优化控制变得更加困难。
传统控制方法,如鲁棒优化、随机规划和模型预测控制等,依赖于系统不确定性因素的分布知识或预测信息。然而,获取准确的分布知识或预测信息往往困难且不现实,因此这些方法难以适应实际环境的动态变化。深度强化学习方法目前在多能系统调度中展现出较大发展优势,通过深度神经网络与强化学习技术的结合,系统可以通过与环境的交互学习最佳决策策略。深度强化学习能够应对复杂、非线性系统及不断变化的条件,无需显式模型。系统通过与环境的交互,根据奖励信号优化决策,持续改进性能。这种方法在实时性要求高、需求和资源波动大的情况下效果显著。
碳排放流(碳流)被视为依附于系统能量流的一种虚拟网络流,其目的是实现碳要素在系统各个环节的准确追踪,并将碳排放从源到负荷进行分配。基于碳流的追踪可实现精确的负荷侧碳排放计量,将负荷侧碳排放量纳入优化目标,有助于系统的低碳化运行。
有鉴于此,为应对多能系统运行中供能侧可再生能源发电、负荷侧不可控需求及提升多能系统的低碳性,特提出本发明。
实现思路