本技术介绍了一种创新的遥感图像分割技术,该技术结合了通道增强和多输入特征融合。首先,收集高分辨率遥感图像的训练样本集,然后构建基于通道增强的Swin Transformer编码器,旨在提高遥感图像分割的准确性和效率。
背景技术
在高分辨率遥感图像语义分割的研究中,主要目标是开发能够有效处理超高分辨率图像的方法,尤其是在有限的GPU内存下,提供高质量的分割结果。这需要解决当前方法中存在的一些问题,如边界不清晰、小目标丢失以及训练过程的复杂性和耗时。此外,这些方法应在保持分割精度的同时,充分利用遥感图像的超高分辨率特性,例如有效捕获和利用全局上下文信息与局部细节信息。目前,主流的语义分割网络通常采用基于编码器-解码器的结构,其具体过程如方程所示:式中,E(X)为编码器,用于对源图像X进行特征提取,提取的特征为F;D(F)为解码器,用于对提取到的特征F进行解码,重建出与源图像对应的分割图像
在编码器部分,当前主流方法采用SwimTransformer进行特征提取,以获取更丰富的特征图。然而,在处理特征图的过程中,SwimTransformer的各个通道之间的计算是相互独立的,这意味着忽略了通道之间的关联信息。这种独立计算方式限制了其提取和利用通道间交互信息的能力。因此,尽管SwimTransformer在单一通道上的特征提取表现优异,但在整体通道间特征融合和信息互补方面仍存在一定的局限性。在解码器部分,与传统机器学习方法相比,基于卷积神经网络(CNN)的方法能够捕获更精细的局部上下文信息,这为其在特征表示和模式识别方面提供了巨大潜力。然而,固定感受野的卷积运算主要用于提取局部特征,缺乏对全局上下文信息或长距离依赖关系的建模能力。在语义分割中,仅对局部信息建模通常会导致全局像素级分类的歧义,因为每个像素的语义内容在全局上下文信息的帮助下变得更加准确。此外,当前主流方法在卷积过程中采用混合堆叠多种特征的卷积方式,尽可能提取特征与目标间的复杂非线性关联,但这无疑增加了网络的运算复杂度。在传统的卷积模板中,整数阶微分算子通常适合处理图像中高频变化的成分,但对非连续边界点和低频变化特性的细节处理能力较差。图像中的丰富表面纹理细节属于中低频成分,而整数阶微分算子难以有效处理。
因此,如何有效处理超高分辨率遥感图像的语义分割,提供高质量的分割结果,成为本领域技术人员亟需解决的问题。
实现思路