本申请提供了模型验证样本生成方法、装置、设备和存储介质,涉及人工智能技术领域,可以应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景,方法包括:获取目标模型,以及目标模型对应的样本训练集和代理模型;基于原始训练样本和对应的初始对抗扰动对目标模型进行非定向攻击,得到第一对抗样本,目标模型针对原始训练样本的第一输出结果与针对第一对抗样本的第二输出结果满足第一对抗条件;以原始训练样本的样本标签为期望输出,基于第一对抗样本对代理模型进行定向攻击,得到第二对抗样本;对第二对抗样本进行对抗验证测试,在对抗验证结果为验证通过的情况下,将第二对抗样本确定为模型验证样本。本申请能够有效降低样本生成成本。
背景技术
验证样本是一种保护人工智能模型版权的手段,理想状态为验证样本仅在指定模型上产生预设输出,以实现指定模型的版权验证和保护。现有的验证样本构造方案,需要知晓模型的详细结构和参数,构造样本的代价较大,增加了模型信息的泄漏风险,并且样本构造过程中需要重新训练模型,调整模型参数和权值,在增加模型保护成本的同时,影响模型的稳健性。此外,现有的验证样本构建方案通常针对某一特定种类的模型,如分类模型或针对图像数据的模型,泛化性差,且样本具有较高的迁移性,置信度低。
实现思路