本技术介绍了一种新型的医学影像预训练方法及系统,该方法融合了高斯分布中心裁剪和局部梯度方向分布掩码选择策略,旨在提升医学图像预训练的效果。
背景技术
中心裁剪和随机裁剪是三维医学图像分割训练过程中的常见图像预处理方法。中心裁剪是从图像中心区域截取固定大小的片段。其主要目的是捕获图像中最重要的部分,通常是包含关键解剖结构或病灶的区域。由于医学图像通常具有较高的分辨率和较大的尺寸,直接使用整个图像进行处理可能会带来巨大的计算开销和冗余信息。通过中心裁剪,可以有效地减少图像尺寸,提高计算效率,同时保留最具诊断价值的区域。这种方法特别适用于那些目标区域集中在图像中心的场景,比如某些类型的肿瘤检测或器官分割。
随机裁剪则通过随机选择图像中的任意区域进行裁剪,以增加数据的多样性,从而帮助模型提高泛化能力。随机裁剪可以生成不同位置的图像片段,覆盖更广泛的特征空间,减少模型对特定区域或特定结构的依赖。这对于处理图像内容分布不均匀或目标区域位置不确定的情况尤为重要。通过增加训练数据的多样性,随机裁剪能够有效地提高模型在未知数据上的表现能力。
在掩码重建预训练领域,随机掩码和渐进掩码是常见的掩码选择策略。随机掩码通过随机选择图像中的区域进行掩盖。在训练过程中,随机掩码会选择图像的不同部分进行遮盖,从而迫使模型在重建过程中利用图像的其他未被遮盖的部分进行预测和恢复。这种方法能够有效地提高模型对部分缺失信息的恢复能力,增强其鲁棒性。然而,随机掩码的一个潜在问题是可能无法充分利用图像中的所有信息,特别是在掩盖区域较小时,模型可能会倾向于依赖未被遮盖的区域进行恢复。
渐进掩码通过逐步增加掩盖区域的大小或数量,帮助模型从简单到复杂逐步学习特征。这种方法旨在使模型在训练初期处理较为简单的任务,例如恢复小范围的缺失区域,随着训练的进行,逐步增加掩盖的难度,让模型面对更为复杂和大范围的缺失信息。渐进掩码可以有效地引导模型逐步适应和学习从简单特征到复杂特征的过程,从而提升学习效果和泛化能力。
现有使用了一种随机裁剪进行采样的方法,随机裁剪可能会去除图像中的关键特征或信息,而且由于裁剪区域的不确定性,模型在不同训练批次之间可能接收到的信息量和复杂度不一致,可能影响训练的稳定性。
现有另一种使用了一种中心裁剪进行采样的方法,中心裁剪过度依赖中央区域,会导致模型对非中央信息的敏感度降低,忽略边缘区域包含的有用特征。
现有还一种使用了一种随即掩码策略对数据进行掩码处理,随机掩码可能会覆盖到背景区域,忽视图像中的关键特征区域,导致模型无法有效学习到图像中重要的前景特征,掩码的随机性可能导致模型在不同训练批次之间接收到的信息量不一致,从而影响训练的稳定性。
现有再一种使用了一种渐进掩码策略对数据进行掩码处理,渐进掩码策略随着训练的进展,逐步增加掩码区域的大小或数量可能延长训练时间,在训练初期掩码区域较小时,模型可能会过度依赖未掩盖的特征,导致对这些特征的过拟合。
实现思路