本技术公开了本发明中所述的捆扎机器人视觉系统中深度学习训练方法和数据集的优化方法,包括对工业现场钢筋捆扎作业进行细致采样;完成数据集创建与标注;图像处理与数据集构建;针对性深度学习模型训练,场景适应性优化与模型验证。本发明通过更加精确和平衡的数据集创建与优化,显著提高了模型的识别精度和泛用性。并通过动态的数据集更新和基于置信度的反馈调整,能够持续适应不同的工作环境,有效应对光线和外界条件的变化,保证了系统的稳定性和可靠性,图像增强和数据平衡策略有效地提高了稀有类别的样本数量,进而提高了整个视觉系统的性能。
背景技术
随着智能建造的兴起,自动化车间已经成为了建造业中的主流。其中视觉识别在自动化车间中起到了不可或缺的作用,已经被广泛应用在各种工业车间流水线中。尽管这一技术被广泛应用,但其面临着一些关键挑战。 主要问题在于,当前视觉检测方法依赖于数据驱动的深度学习,但缺乏针对特定项目的通用公共数据集。而自建数据集由于难以在短时间内得到非常大量的数据,而过于少的数据量会导致训练出的模型精度和泛用性都很低。尤其是当工业车间中光线和外界环境对识别区域造成影响后,识别精度会进一步降低。针对这一问题,需要工程师针对不同场景重新修改训练参数,进行多次训练优化。这不但增加了开发人员的工作量,导致工作效率低下,而且重新训练的模型可能仍有相同的问题,不利于视觉系统的通用化和标准化发展。因此,现有技术在数据集管理和模型适应性方面存在显著不足。
实现思路