本技术介绍了一种利用对抗性鲁棒训练提升人脸图像预保护效果的方法和设备。该技术通过深度神经网络构建学习型基础保护模型,并将原始人脸图像输入模型以生成保护后的图像。
背景技术
随着互联网时代的蓬勃发展,图像逐渐替代文字成为信息传递的主要媒介。因为“眼见为实”,通常人们对图像所传递的信息具有更强的信任程度,这使得个体、社会间的交流与沟通更加高效;但同时也导致了以图像为载体的虚假信息具有更大的危害性。针对这一棘手的问题,现有的解决方案大多依靠人工对敏感内容进行内容审核。然而,随着深度人脸编辑技术的不断进步,海量极高质量的人脸编辑图像涌入互联网,这使得依靠现有的人工审核方式来过滤这类虚假信息变得愈发举步维艰。应运而生的自动化审核方式通过在训练集上拟合已知的伪造特征,使用深度神经网络对图像进行真假辨别。然而,这种方式仍然难以扩展到未知的编辑方法上,导致泛化性不足的问题。另外,已有一些研究工作关注到利用对抗噪声进行主动性的防御。这类方法可以通过对图像添加肉眼几乎不可见的噪声,使得人脸编辑方法无法实现原有的编辑效果。虽然初步实验已经验证了该方案的有效性,但是两方面的缺陷使得该方案在实际应用中受阻。第一点是效率问题,基于传统的迭代式优化算法实现的方案需要针对每一张输入的图像进行多次的迭代优化,而这个过程极其消耗时间和计算资源。第二点是鲁棒性问题,现有方法大多忽略了经保护后图像可能遭遇互联网中普遍存在的后处理问题,而这些简单的后处理操作可能导致已有的保护措施失效。
实现思路