基于Transformer的视频行人重识别技术:强化时间关系
2025-02-16 12:30
No.1340661546694746112
技术概要
PDF全文
本技术介绍了一种视频行人重识别方法,该方法特别强调长短期时间关系的重要性。该方法首先将训练数据输入到Transformer网络中,借助其卓越的建模能力,以捕捉行人在视频中的时间特征。
背景技术
近年来,随着智能监控等领域的广泛应用,行人重识别引起了越来越多的关注。根据查询的类型,行人重识别可以分为基于图像和基于视频两类方式,与基于图像的行人识别相比,基于视频的行人识别具有更加丰富的时间和空间信息,这些信息可以用于减少视觉模糊性,从而提高行人重识别的鲁棒性和准确性;基于视频的行人重识别更贴近实际应用场景,并且具有更高的实用价值,虽然视频行人重新识别技术已经取得了显著进展,但是目前大多数方法并没有充分利用视频数据中丰富的时空线索,这限制了它们的鲁棒性和准确性。 针对空间线索的提取,现有的方法主要采用注意力机制、基于局部特征和多尺度等技术进行特征增强;虽然这些方法取得了不错的效果,但它们的本源仍存在一定局限性,这些方法所提取的特征信息准确性取决于其感受野范围,而常规的方形卷积并不能很好地适应非方形的特征区域。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
何智敏  钱江波
技术所属: 宁波大学
相关技术
新场景下目标检测性能自适应度量方法 新场景下目标检测性能自适应度量方法
基于自协作并行生成对抗网络的无监督真实图像去噪方法 基于自协作并行生成对抗网络的无监督真实图像去噪方法
基于采样差异作为扰动的自监督真实图像去噪方法 基于采样差异作为扰动的自监督真实图像去噪方法
基于单幅RGB图像的高光谱重建方法 基于单幅RGB图像的高光谱重建方法
预训练模型的高效微调方法、装置、服务器及存储介质 预训练模型的高效微调方法、装置、服务器及存储介质
一种眼象图质量控制方法、装置、存储介质和设备 一种眼象图质量控制方法、装置、存储介质和设备
图像处理方法及装置 图像处理方法及装置
一种关注长短期时间关系的视频行人重识别方法 一种关注长短期时间关系的视频行人重识别方法
一种基于ID-YOLOv8的老、幼、孕、残检测方法 一种基于ID-YOLOv8的老、幼、孕、残检测方法
一种风电叶片用拉挤板材表面缺陷的检测方法及系统 一种风电叶片用拉挤板材表面缺陷的检测方法及系统
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利