本技术涉及一种融合注意力机制的全局至局部关键点检测技术与设备,主要步骤包括:步骤1,利用摄像头捕获图像并标记关键点,对图像数据进行预处理以构建关键点检测数据集。
背景技术
关键点定位任务是指在给定的图像中识别出一些特定的、显著的点,这些点通常是对图像内容具有重要信息的特征点。例如,在面部识别中,关键点可能是眼睛、鼻子和嘴巴等的位置;在物体检测中,关键点可以是物体的边缘、角点等位置。关键点定位任务的深度学习方法利用深度神经网络从图像中提取结构和语义信息,分析处理其复杂特征,从而精确地预测每个关键点的坐标,是计算机视觉领域中一个融合图像处理和机器学习的关键应用分支,广泛应用于人体姿态估计、物体识别等场景,为实现图片相关应用的自动化和智能化提供了重要技术支持。
现有关键点自动定位方法中,利用图像梯度和二阶导数矩阵的方法对图像的光照变化和噪声敏感,基于特征点描述符和匹配算法的方法无法灵活应对大规模或动态变化的场景,深度学习方法通常通过热图回归或坐标回归模型直接从图像特征中回归出关键点坐标。然而,直接回归过于依赖关键点周围区域的纹理特征,导致在纹理特征较弱的区域关键点定位误差较大。此外,使用注意力机制学习不同关键点之间的相对关系时,往往忽略了全局特征对于纹理弱区域定位的关键作用,从而降低了关键点定位的精确度。
因此,为了减小关键点定位误差,同时考虑到弱纹理区域局部视觉特征不足以支撑直接精确定位图片关键点坐标的问题,本发明提出了一种基于融合注意力的全局到局部关键点定位方法及装置。
实现思路