本技术公开了基于多任务自适应模型的轧制金属表面缺陷自动标注方法,包括:S1、采集轧制金属表面图像,对其预处理及增强后进行数据标注,构建轧制金属表面缺陷数据集;S2、构建多任务自适应模型,并利用数据集对其训练,得到缺陷自动标注模型;S3、将待标注的金属表面图像输入至缺陷自动标注模型中,通过执行目标检测任务输出表面缺陷标注结果。该方法结合多任务学习框架,实现对轧制工艺中金属表面缺陷的目标检测与实例分割任务的联合训练,并在推理阶段专注于目标检测任务,以提升标注效率,本发明标注方法显著减少人工成本,能够广泛应用于轧制工艺金属的工业缺陷检测和数据自动标注场景,适用于复杂工业环境中的缺陷图像自动标注任务。
背景技术
基于深度学习的轧制金属表面缺陷检测方法,依赖于大量标注精确的缺陷图像数据集,以支持模型训练中对缺陷特征的深入学习,从而实现对不同类型工业缺陷的精准定位与分类。数据集的规模与质量对于目标检测算法的性能和鲁棒性至关重要。大规模且高质量的数据集能够为模型训练提供丰富的样本分布,从而显著提升模型在实际检测任务中的准确性和可靠性。然而,获取这样的大规模、高质量的数据集是一个巨大的挑战。标注错误或缺乏详细标注信息的低质量数据可能会导致模型学习到错误的特征模式或无法充分提取目标特征,进而影响目标检测任务的整体性能。诸如COCO和ImageNet等著名数据集拥有百万级的高质量样本,这些数据经过严格的筛选和标注流程,确保了数据集的高质量。由此可见,规模庞大的精确标注数据集对于训练高性能目标检测模型至关重要。
目前,人工标注缺陷数据集的方法存在显著劣势与局限性。人工标注过程劳动密集,标注人员需逐一检查图像,精确绘制边界框或进行像素级标注。然而,工业生产过程中每日生成的数据量可能达到TB级,人工标注难以满足如此高效的数据需求,且成本极为高昂。此外,人工标注质量难以保证,受标注人员的主观判断及疲劳影响,标注结果可能缺乏稳定性。标注人员之间的标注风格差异也会导致标注结果不一致,长期高强度的标注工作进一步加剧疲劳累积,影响标注质量。
轧制金属生产工艺中的缺陷检测具有其独特的技术挑战。首先,由于轧制工艺涉及的高强度变形和拉伸,易导致金属表面出现多种不同类型的缺陷,例如划痕、凹陷、气孔、杂质及氧化斑等。这些缺陷形态复杂、分布不均且尺寸差异显著,其中部分缺陷在视觉上难以区分,给传统的单一检测方法带来了极大挑战。此外,轧制工艺的连续性和生产速度要求实时缺陷检测,以避免不合格产品进入后续加工环节。基于以上特点,传统的单任务标注方法难以充分学习到不同缺陷类型的特征,极易导致模型泛化能力不足,难以适应多样化的检测需求。
针对上述问题,公开(公告)号为CN118279660A的中国发明专利提出了一种基于深度学习的智能驾驶数据自动标注方法。该方法包括以下步骤:步骤S1,获取智能驾驶数据并对其进行预处理,通过数据增强方法对预处理后的数据进行扩展,随后将数据发送至第一阶段卷积神经网络。通过骨干网络提取多尺度特征,并将这些特征发送至朴素检测器,在后处理后输出初步的一级框定位坐标;步骤S2,扩大一级框的定位范围,获取外扩坐标。该发明提高了标注结果的准确率,并提升了数据标注效率与质量。
另一项公开(公告)号为CN118334429B的中国发明专利提出了结合Deeplabv3plus网络的工业射线检测缺陷图片快速标注方法。此方法包括以下步骤:步骤1,使用Photoshop对部分数据进行标记、裁剪和筛选;步骤2,将处理后的数据划分为训练集和验证集,使用Deeplabv3plus网络进行训练;步骤3,在验证集上测试平均交并比和准确率,若达到标准,则对剩余数据进行自动检测标注;步骤4,对已标注数据进行微调以提升标注质量。
虽然上述两项发明实现了自动标注的部分功能,但仍存在一些技术瓶颈。首先,它们依赖于单一网络和少量有标签数据来辅助无标签数据的标注,标注精度有限,标注质量容易受到模型预测误差的影响。在单一网络框架中,如果初始标注出现误差,这些误差可能会在后续任务中累积并扩散,影响标注准确性。此外,这些方法通常针对特定的标注任务进行设计与训练,缺乏灵活性,难以适应多种不同的标注需求,且领域间的差异限制了迁移学习的效果。迁移学习要求源领域和目标领域之间具有一定的相似性,当两者差异过大时,单一任务的迁移学习效果显著下降,甚至可能失去标注的实际意义。
实现思路