本技术公开一种轻量化手势识别方法、系统、电子设备及存储介质,涉及计算机视觉技术领域。所述方法包括:获取待检测数据;所述待检测数据包括图片数据和视频数据;将所述待检测手势输入训练好的手势识别模型进行预测,并输出当前帧的手势位置及手势类别;所述手势类别包括one手势、five手势、fist手势、ok手势以及yeah手势;所述手势识别模型是基于YOLOv8n基础网络、GB‑C2f目标检测模块和F‑FPN融合型特征金字塔网络构建的。本发明能够提高手势识别的推理速度和检测精度。
背景技术
随着人工智能的快速发展和人机交互应用场景的日益复杂,传统的人机交互方式逐渐暴露出其局限性。为了应对这些挑战,新的交互方式不断涌现,其中,手势识别因其灵活、快捷、高效的特点在多个领域受到了广泛关注和深入研究。手势识别的视觉技术为用户提供了一种自然且直观的交互方式,可在互动娱乐、智能家居、手语识别、智能车载等应用场景中得以使用,提升了用户体验。
手势识别技术的应用呈现出多样化的优势和潜力,为了提高手势识别的准确性和效率,深度学习技术成为一种有力的解决方案。常采用的深度学习技术主要分为单阶段和双阶段的目标检测算法,其中,单阶段算法,如SSD、YOLO等,虽然计算速度更快,但精度略有损失;两阶段目标检测算法,如Fast R-CNN、CornerNet等,对特征提取更充分,但速度相对慢。
实现思路