本技术介绍了一种图像处理技术及其配套设备,该技术包括:接收原始图像及其相关需求描述;将原始图像分割成多个局部图像块,每个局部图像块分别处理;根据需求描述对局部图像块进行优化处理;最后将优化后的局部图像块重组为处理后的图像。
背景技术
大模型是一种大型深度学习模型,其核心思想是将不同信息(例如文本、图像、音频和视频等)进行融合,通过学习不同信息之间的关联,实现更加智能化的信息处理。在大模型中,不同的信息经过预处理后被输入到一个大模型中,经过多层的特征提取和融合,最终输出相应的结果。
相关技术中,在大模型中,对于输入的图像,会将图像统一调整至一个固定的分辨率,且这个分辨率的大小一般仅为448×448,这会导致部分高分辨率图像在输入大模型时,其分辨率被严重压缩,造成视觉信息的损耗,因此大模型在处理高分辨率图像时面临挑战,无法很好的处理高分辨率图像。
实现思路