本公开提供了一种基于多模态语义信息的行人重识别方法、装置及设备,该方法包括:获取若干监控画面;将若干监控画面作为预先训练完成的多模态目标检测模型的输入,以使多模态目标检测模型根据各监控画面进行检测,确定各行人对应的外貌特征标签以及各外貌特征标签对应的深度特征;将与目标检索对象的外貌特征标签全部相同的行人确定为待识别人员;基于目标跟踪算法,确定目标检索对象以及各待识别人员在各自监控画面中的运动轨迹,并确定目标检索对象与各待识别人员之间的轨迹相似度;将轨迹相似度大于或等于预定阈值的待识别人员确定为目标检索对象。本申请实施例的技术方案可以在提高行人重识别的效率的同时,保证行人重识别的准确性。
背景技术
行人重识别是指对于同一个人在不同画面中的影像进行匹配,从而识别画面中目标的身份和行进路线,其广泛应用于自动化人员追踪场景,在安全监控、人流分析、智能交通等领域扮演着日益重要的角色。在目前的技术方案中,部分行人重识别方法通过结合行人的多种特征(如颜色、纹理、运动等信息)以进行行人识别。然而,上述方式往往需要复杂的数据预处理和特征工程,且在融合不同模态信息时容易面临信息丢失或不一致的问题。由此,如何在提高行人重识别的效率的同时,保证行人重识别的准确性成为了亟待解决的技术问题。
实现思路