本技术介绍了一种创新的多目标跟踪方法,该方法采用目标置信分层关联策略。通过输入视频V,将其分解为独立的帧序列f<sub>k</sub>,进而实现对帧中目标的精准跟踪。
背景技术
摄像头在生活中使用与日俱增,构建了一个无处不在的数字眼睛网络。这些摄像头被广泛应用于监控系统、无人驾驶系统和机器人视觉系统。然而,摄像头数据支撑系统进行自主智能决策的核心之一是快速准确的识别、跟踪场景中的潜在目标,特别是实时性高的系统。此外,智能机器人自身智能离不开机器视觉技术,在多人活动的复杂动态场景,准确的识别跟踪特定目标的多目标跟踪技术(MOT),是确保机器人实现准确的行为感知与监控、提供个性化类人服务等自主决策的核心。
多目标跟踪任务通常被分解为目标检测和数据关联两个子任务。得益于当前目标检测技术的迅速发展,借助强大的检测器也取得了良好的跟踪速度,并且在数据关联任务中结合线索辅助目标与轨迹的关联。现有技术中,通过利用检测框置信度和高度变化这一类“弱线索”,提高了跟踪算法的关联能力。在数据关联阶段,级联匹配是MOT研究中常用的方法,DeepSORT优先将年龄较小的轨迹与检测对象匹配,ByteTrack则优先将高置信度的检测目标与已存在轨迹进行匹配。但还存在以下问题:跟踪过程中目标本身的尺度变化和目标之间频繁重叠导致的跟踪丢失和身份ID错匹配的问题,导致复杂动态场景中跟踪目标的准确性和鲁棒性差。
实现思路