本技术方案涵盖图像处理领域,介绍了一种图像识别技术,包括方法、装置、设备、存储介质和计算机程序产品。该技术通过在视觉感知模型中集成图像特征调整网络,并采用多分辨率图像样本进行迭代处理,以提高识别准确性和效率。
背景技术
图像识别是计算机视觉(Computer Vision)的一个常见应用,其主要任务是通过对采集的图像进行信息识别以获得相应的场景信息,在自动驾驶、智能机器人、智能家居、智慧终端以及交通运输、航空遥感、工业产品装配等工业生产等领域均有广泛的应用。
在执行图像识别任务时,视觉感知模型决定了检测的精度。在实际应用中,有时需要视觉感知模型能够处理不同分辨率的输入图像,例如针对计算资源有限的应用场景通常采用分辨率较低的图像样本训练视觉感知模型,针对小目标、远距离目标的感知场景则采用分辨率较高的图像样本训练视觉感知模型。但是,若视觉感知模型在推理计算阶段的输入图像的分辨率与训练阶段的图像样本的分辨率不同,则会导致视觉感知模型的检测精度明显下降。这导致在实际应用中,视觉感知模型一旦部署,就只能处理固定分辨率的输入图像。
如何提升计算机视觉的图像识别任务中适应不同分辨率的输入图像的分辨率泛化能力,是本领域技术人员需要解决的技术问题。
实现思路