本技术属于图像处理技术,特别涉及一种人脸深度伪造主动检测方法及检测系统,方法包括将可学习的保护信息通过深度图像融合网络嵌入原始图像中得到受保护的图像,深度图像融合网络对受保护图像进行逆向处理得到隐秘保护信息,并计算隐秘保护信息与嵌入图像的可学习的保护信息的残差;将得到的残差输入联合训练的判决器判断待检测图像是否被篡改。本发明一方面对多种类型的深度伪造方法都能有很好的检测性能,另一方面本发明嵌入的保护信息能够不受图像传播中良性图像变换。
背景技术
作为人工智能生成模型主要应用之一,深度伪造技术已成为一种强大的工具,可以通过修改原始面部的身份、属性或表情来创建虚假的面部图像或视频。一方面,深度伪造技术已广泛应用于电影行业、娱乐应用和广告中。与此同时,也有不法分子利用深度伪造技术创建虚假新闻、网络欺诈等,极大的危害了社会稳定。虽然相关的人工智能生成内容法规正在逐步成熟,但在技术层面上,我们仍然需一种有效手段,能够在保证准确的识别图像是否经过了恶意伪造。
在研究领域,现有的人脸深度伪造检测方法可归纳为两大类:
1)人脸深度伪造被动检测技术。
人脸深度伪造技术的缺陷常导致生成的图像带有各种不真实的伪影,因此Deepfake的被动检测技术成为现有人脸深度伪造防御的主要方向之一。这些检测方法通常依赖于识别伪造图像中的异常特征或伪影,通过分析人脸的边界、纹理细节,以及重建误差等线索来判断图像的真实性。随着图像在网络上经历多次压缩,传统的空域检测方法面临挑战,因为压缩后伪造痕迹变得更加难以察觉。为应对这一问题,研究人员开始探索从频域角度提取检测线索,试图从不同频段或多尺度特征中捕捉伪影痕迹。然而,尽管这些被动检测方法对部分伪造技术表现出较强的检测能力,但在面对复杂的伪造数据集或新型伪造模型时,检测效果可能会显著下降,泛化能力不足。因此,当前的被动检测方法仍需进一步改进,以应对不断演变的伪造技术带来的新挑战。
2)人脸深度伪造主动检测技术。
基于主动取证的防御方法不要求破坏深度伪造模型的生成结果,而是聚焦于溯源与身份认证。这些方法包括将隐写技术或水印嵌入图像中,以便在伪造图像中识别和提取嵌入的信息,实现伪造溯源。部分方法还利用嵌入的保护信号来定位深度伪造的区域,或者通过鲁棒水印技术在图像经历篡改或压缩等变换后,仍能有效识别和恢复原始信息。虽然这些方法在防止伪造方面显示出一定的有效性,但它们通常侧重于特定类型的深度伪造技术,并可能无法广泛适用于所有伪造场景。此外,这类方法在实际应用中也面临一些挑战,如嵌入水印或保护信号可能极大影响原图像质量,或者在高强度攻击下保护效果可能减弱。
实现思路