本技术涉及数字病理学与图像处理技术交叉领域,提出了一种用于病理图像的自监督染色标准化方法和装置。该技术包括构建病理图像数据库和设计染色标准化模型,模型包含公共特征域提取和特定特征域提取,通过自监督学习优化染色标准化效果,提高病理图像分析的准确性和一致性。
背景技术
数字病理学的发展和计算机视觉算法的进步推动了人工智能技术在病理学领域的应用。然而由于医疗数据的隐私保护,病理数据通常无法集中而形成事实上的“数据孤岛”。在此背景下,以单个大型医疗机构为主体训练定制化的智能辅助模型,是一种直接且安全的解决方案。现实世界中,大型医疗机构由于具有相对更专业的知识和经验来进行病理学分析和诊断,因此积累了丰富的医疗资源和患者数据。以服务其为目标进行单中心的病理智能辅助模型设计,能够避免向开发者进行多中心数据的共享,最大限度地服务自身和保障患者的数据隐私安全。
然而病理中心间不同的样品制备程序以及使用的不同成像设备等会导致最终得到的病理图像出现染色风格上的差异,这种差异性使得在单个大型医疗机构训练的病理智能辅助模型通用性差,难以泛化到未参与训练的其它医疗机构,阻碍了先进医疗技术的共享和推广,因此亟需能实现对未知病理中心的图像进行染色归一化的预处理方法。
为解决不同医疗机构病理图像染色差异问题,现有的染色归一化方法主要分为两类:(1)传统染色归一化方法;(2)基于深度学习的染色归一化方法。其中,传统的染色归一化方法主要依赖于数学算法和图像处理技术,利用图像的颜色分布或统计特征进行染色归一化处理。这些方法需事先从目标染色风格数据集中选择模板图像,因此主要适用于小规模数据集且其中图像染色风格较为一致的情况。基于深度学习的方法是当前染色归一化领域的主流技术,其能够自动从参与训练的数据中学习复杂的染色风格转换,进而实现更为精确的染色风格归一化,典型的如基于生成对抗网络的风格迁移技术。
然而,上述第(1)类方案虽然操作简便,但通常只能涉及到两种染色风格的归一化且严重依赖于目标风格中模板图像的选择,而该模板图像通常不能完全代表单个病理中心中所有样本的染色特征,导致染色归一化的结果出现偏差。上述第(2)类方案通常是基于生成对抗网络,可以对多种已知的染色风格进行归一化,但其训练过程复杂,计算资源消耗大,且生成的图像可能存在伪影或失真,尤其是在在高频纹理或复杂组织结构的细节处理上。
更关键的是,两类方案都需要目标染色风格数据的参与、需要将数据集中,这导致一方面无法做到对患者数据的隐私保护,另一方面也无法做到对未参与训练的未知病理中心数据的染色归一化,进而难以帮助更多中小型医院在不需要开源患者数据的情况下使用到由单个大型医疗中心开发的先进病理智能辅助模型。
实现思路