本技术属于图像处理技术领域,详细描述了一种创新的图像识别技术,包括方法、装置、设备、存储介质及计算机程序产品。该技术利用多分辨率图像样本对视觉感知模型进行训练,并在迭代过程中调整分辨率,以优化识别效果。
背景技术
计算机视觉(Computer Vision)是人工智能技术的一个重要分支,它的主要任务之一是通过对采集的图像进行处理以获得相应的场景信息,在自动驾驶、智能机器人、智能家居、智慧终端以及交通运输、航空遥感、工业产品装配等工业生产等领域均有广泛的应用。
视觉感知模型是计算机视觉技术的核心之一,视觉感知模型的感知能力决定着人工智能的视觉理解能力。由于不同应用场景的需求差异,在训练视觉感知模型时需要采用不同的图像样本,如针对计算资源有限的应用场景通常采用分辨率较低的图像样本训练视觉感知模型,针对小目标、远距离目标的感知场景则采用分辨率较高的图像样本训练视觉感知模型。为提升视觉感知模型处理不同分辨率的输入图像的分辨率泛化能力,需要采用不同分辨率的图像样本训练视觉感知模型,但由于不同分辨率的图像的特征分布存在较大差异,导致模型优化难以成功,致使实际应用中只能部署处理特定分辨率的视觉感知模型来处理图像识别任务。
如何提高计算机视觉适应不同分辨率的输入图像的分辨率泛化能力,是本领域技术人员需要解决的技术问题。
实现思路