本技术公开了一种基于时序图像特征更新的人体姿态估计方法及装置,本发明首先收集并预处理视频数据。其次利用预训练的NanoDet模型进行人体目标检测,获取人体边界框信息;然后在检测到的人体边界框内执行特征提取,生成姿态特征向量,并将其细分为34个特征子结构。在此基础上,利用当前帧的特征子结构更新历史特征子结构,生成反映当前t时刻的34个综合特征子结构。最后,将综合特征子结构重新组,通过解码器以精确估计出人体的完整姿态。本发明显著提高了人体姿态估计的精度与鲁棒性,克服了现有技术中依赖单帧图像进行姿态估计的局限性。
背景技术
人体姿态估计领域的现有方法主要依赖于深度学习模型,尤其是基于卷积神经网络(CNN)的技术,通过图像特征提取和人体关键节点预测来估计人体姿态。尽管这些方法在一定程度上取得了良好效果,但由于仅依赖单帧图像,往往难以在复杂场景下提供准确的姿态估计结果,不确定性干扰如遮挡、光照变化和人体姿态多样性等情况。例如,中国发明专利公开号为CN118351577A公开了一种基于卷积神经网络的人体姿态评估方法,该方法通过卷积网络模型对单帧图像进行特征提取,进而获取人体骨架信息。同样,CN118506402A的专利公开了一种结合卷积神经网络和注意力机制的轻量级人体姿态估计及行人跌倒检测方法,依然是依赖单帧图像的姿态估计。
实现思路