本技术介绍了一种利用深度孪生自注意力网络进行复杂目标识别的技术。该方法属于目标识别技术领域,通过采用滑窗多头自注意力变换机制的孪生网络,提升了特征提取网络的能力。
背景技术
在复杂的图像场景下,影像的视觉空间因同谱异物或同物异谱现象,同类地物的光谱特性差异变大,异类目标的光谱特性相互重叠,使得类内方差变大,类间方差变小,这会使图像特征细节与高级语义信息混淆,仅依靠专家人眼识别无法解决。传统算法例如颜色聚类法,无法挖掘图像背后更深层次高级语义信息,这致使其对图像的局部全局理解浅,完成任务效率低。所以要借鉴人工智能深度学习算法来完成任务,识别图像中蕴含的高级信息。
同时随着数字视觉技术的发展,各领域图像正向着大数据量、多元种类信息发展,图像识别语义分割任务在国土资源普查、地理信息测绘、自动驾驶导航、医疗影像检测等多个领域有着极大的应用价值,准确有效地从图像中进行识别精确细节特征同时提炼出准确语义信息,平衡信息种类有着实际需求。
人工智能算法能够将具体的显性特征提取分析,抽象概括为高级语义信息,将具体提炼抽象这一过程系统化,增强效率与准确率。同时过程中会丢失特征细节。视觉空间的主要任务是分割定位特征细节,语义空间的主要任务是总结学习高层概念信息,这就是矛盾所在。
在大量的复杂图像场景下,会面临图像的底层特征与高层语义信息之间不平衡,近似特征识别混淆,局部定位分割位置不准确,小尺度特征被忽略,全局因多尺度变化而上下文信息交换不充分以及处理大样本的数据量等问题。这些问题使语义分割任务对于把握多尺度下的细节特征以及语义信息的平衡性更加具有挑战性。
目前市面上常见的基于卷积神经网络的复杂目标识别方法,使用级联的卷积和池化操作进行特征提取。由于卷积核的大小通常为3×3或5×5等小尺寸,因此卷积操作的感受野有限,相当于每次卷积操作都是对图像或特征图中一块极小区域的运算。在较浅的卷积层,仅能提取出小尺度特征,无法建立有效的长距离依赖,而在较深的卷积层,能够得到全局语义信息,但丢失了部分细节。为了解决上述问题,本发明提出一种基于深度孪生自注意力网络的复杂目标识别方法。
实现思路