医学图像数据集中的标签往往存在噪声或错误标注,极大地影响了深度神经网络(DNNs)在医学图像分析中的性能。为了解决这一问题,本文提出了一种新颖的框架——协助标签校正网络(Co‑assistant Networks for Label Correction,CNLC),用于同时检测和校正被破坏的标签。该框架由两个核心模块组成:噪声检测模块和噪声清理模块。噪声检测模块利用卷积神经网络(CNN)预测样本标签,并通过抗噪损失函数划分样本为干净、不确定和被破坏三类。噪声清理模块则基于图卷积网络(GCN)模型,对不确定和被破坏的样本标签进行修正,同时保持样本之间的局部拓扑关系。为了优化这两个模块的协作效果,本文设计了一种双层优化算法,使得标签检测和修正过程交替进行,最终提高了模型的鲁棒性和标签校正的准确性。在三个广泛使用的医学图像数据集上的实验结果表明,CNLC框架在处理标签噪声问题上显著优于当前的先进方法。
背景技术
在医学图像分析中,深度神经网络的性能很大程度上依赖于数据集的质量。然而,医学图像数据集的标注过程通常复杂且昂贵,容易产生错误标签。错误标签不仅会严重降低深度学习模型的性能,还会导致错误诊断结果。因此,开发一种能够自动检测和校正错误标签的有效方法具有重要意义。
现有的标签校正方法大致可分为两类:鲁棒性增强方法和标签校正方法。鲁棒性增强方法通过各种技术(如数据增强、损失正则化等)来减少模型对错误标签的敏感性,输出更鲁棒的模型;标签校正方法则尝试检测并修正数据集中存在的错误标签。然而,现有方法通常存在以下问题:1)无法同时检测和校正所有错误标签;2)通常忽略了样本之间的关系,导致校正效果不佳;3)未能提高模型本身的鲁棒性。
实现思路