本技术方案覆盖图像处理领域,介绍了一种集成多分辨率调整功能的目标识别方法、装置、设备、存储介质和计算机程序产品。该技术通过在视觉感知模型中引入尺寸调整机制,优化输入图像特征的处理,以提升目标识别的准确性和效率。
背景技术
目标识别是计算机视觉(Computer Vision)的一个常见应用,其主要任务为通过对采集的图像进行处理以获得相应的场景信息,在自动驾驶、智能机器人、智能家居、智慧终端以及交通运输、航空遥感、工业产品装配等工业生产等领域均有广泛的应用。
在执行目标识别任务时,视觉感知模型决定了识别的精度。由于不同应用场景的需求差异,在训练针对不同应用场景的视觉感知模型时需要采用不同的图像样本,如针对计算资源有限的应用场景通常采用分辨率较低的图像样本训练视觉感知模型,针对小目标、远距离目标的感知场景则采用分辨率较高的图像样本训练视觉感知模型。这就导致了在实际应用中,视觉感知模型一旦部署,就只能处理固定分辨率的输入图像。
如何提升目标识别任务中适应不同分辨率的输入图像的分辨率泛化能力,是本领域技术人员需要解决的技术问题。
实现思路