本技术公开了一种基于鲁棒离群值采样的分布外样本识别方法。该方法包括:获取分布内样本数据集,基于目标卷积神经网络对分布内样本数据集进行训练,得到训练后的目标卷积神经网络;对分布内样本数据集中的每个样本用混合度量指标进行量化,得到每个样本的混合度量指标;基于分布内样本数据集中每类样本中的每个样本的混合度量指标,构建每类样本的分布区域;对每类样本的分布区域中的每个样本的混合度量指标进行排序,获取每类样本排序最大的多个样本。本发明解决了现有技术的目标检测中当存在分布外样本时,进行目标检测的卷积神经网络不能对分布外样本进行准确识别的技术问题。
背景技术
随着深度学习技术的研究推进,目标检测为多种产业提供了解决方案。然而,来自封闭域的样本训练的深度神经网络,当暴露于开放世界中的分布外样本时,通常表现出较差的泛化能力。分布外样本是标签集与训练类别没有交集的样本,因此不应该被给出已有类别的预测。为了提高模型的泛化能力,确定输入是否是分布内或分布外的分布外检测问题越来越受到研究界的关注。现有的解决方案主要集中在图像级分布外检测,目的是确定输入是分布内还是分布外样本。然而,对象级分布外检测能够通过从给定图像中找到未知的对象来更好地理解场景。其可以更准确地区分场景内的异常区域和实例,从而为场景理解提供更细粒度的方式,为自动驾驶、医学图像检测、关键安全行为等方式提供解决方案。
一般来说,现有的分布外检测解决方案可以分为三类,包括基于分类,基于密度和基于距离的解决方案。先前方法基于一个假设,他们将ID数据将聚集在一起,形成高密度区域,而OOD数据将出现在低密度区域。例如,VOS方法假设物体特征的分布遵循类高斯分布,而POEM利用汤普森采样精确地描绘决策边界。然而,由于数据样本的多样性,这些假设在真实的世界中可能不成立。此外,大多数现有的解决方案依赖于额外的分布外数据集来正则化模型边界。但辅助数据集不能很好地覆盖所有未知的数据分布,导致模型决策边界有偏。而且,它们主要集中在图像级的分布外检测上,很少研究分布外对象的检测。
实现思路