一种改进的YOLOv7人体关键点检测方法
2025-02-28 12:26
No.1345009220793409536
技术概要
PDF全文
本技术公开一种改进的YOLOv7人体关键点检测方法,该方法通过LabelImage进行手动标注获得丰富的训练样本;将YOLOv7中原有的MP模块替换为L‑MP模块改进特征提取,新增LiftDown Pool分支和残差连接;在YOLOv7网络的Backbone模块和Head模块之间新增EDH‑Conv模块,利用其输出作为空间权重分布来矫正激活区域,进一步提升了网络对小目标的检测能力;增加改进的RSwin Transformer编码器,用于提升对复杂场景中小目标和重叠目标的检测效果;将损失函数参照Wise‑IoU LOSS改为基于L2损失的改进关键点检测损失,并引入用于调整关键点误差权重的动态聚焦机制,加速模型的收敛。该方法增强了对于复杂场景下的人体关键点检测识别能力,对于体育运动中人体关键点检测识别与计数任务有更强的鲁棒性、准确率和效率。
背景技术
人体关键点检测识别是计算机视觉领域中的一个重要的研究方向,在体育领域中,它是动作的分析和评估的一个重要内容,随着体育教育的日益普及和竞技水平的不断提升,对于动作的规范性判断并将标准的动作进行计数变得越来越重要。在该背景下,人体关键点检测和识别任务在动作的规范性判断中发挥着重要作用。因此,利用计算机视觉技术进行人体关键点检测,进而实现动作规范性的识别,成为了体育教育和体育竞技领域中的研究热点。 随着体育运动的规范化和竞技化的发展,传统的分析方式往往依赖于人工观察和记录,这种方式存在差异、人力成本和人员培训开销较高、工作人员可能存在动作标准度判断和计数错漏等问题,从而影响体育运动的公平性和规范性。近年来,随着深度学习技术被广泛应用到人体关键点检测识别领域,极大提高了人体关键点检测识别的的准确度和效率,并减少传统分析方式的人工成本和人为主观影响。但是,在实际应用过程中,处于自然环境下,由于光照强度不同、拍摄角度和距离不同等问题,使得YOLOv7在人体关键点检测识别存在不理想的地方。 对于目标检测,ZENG等人(ZENG LM,HOU J,CHEN Z R,et al.Lightweighttraffic sign detection networkbasedon weak semantic segmentation[J].ComputerEngineering,2022,48(9):269-276,285.)提出基于弱语义分割方法提高在高分辨率输入时目标检测的速度慢、识别精度偏低等不足,设计出一种基于YOLOv4的轻量化改进网络,以改进的MobileNetv3-Lite作为基础语义特征提取网络,以FPN加PAN的组合来实现双重特征融合,额外为检测头设计了一种基于弱语义分割的动态增强附件,且不过多增加模型的浮点运算数,在实际应用过程训练中,在目标检测中综合性能具有较大优势。对于特征上采样,Zhao等人(Zhao J,Snoek C G M.Liftpool:Bidirectional convnet pooling[J].arXiv preprint arXiv:2104.00996,2021.)提出了双向池化层的提升池,包括了下行池和提升池,能够同时执行下池化和上池化。提高了图像分类的准确度和鲁棒性,生成更加精细的上采样特征图,提高了应对细粒度图像分类、超分辨率挑战或对细节保存要求较高的任务。对于视觉变压器方面,Liu等人(Liu Z,LinY,Cao Y,et al.Swin transformer:Hierarchical vision transformer using shifted windows[C]//Proceedings of theIEEE/CVF international conference on computer vision.2021:10012-10022.)提出改进后的SwinTransformer,通过一个分层变压器,并由移位窗口计算来解决语言到视觉的差异。移位加窗口的方案,将注意力计算限制在非重叠的局部窗口上,同时允许跨窗口连接,取得了更高的效率。并证明了分层设计和移位窗口方法对全MLP架构是有益的。对于损失函数方面,Tong等人(Tong Z,ChenY,Xu Z,et al.Wise-IoU:boundingbox regression losswith dynamic focusing mechanism[J].arXiv preprint arXiv:2301.10051,2023.)提出一种基于IoU的动态非单调FM的损失方法,并根据梯度增益分配策略来降低高质量锚盒的竞争力,减少低质量例子的产生有害梯度,提高探测器的整体性能。 综上所述,虽然YOLOv7在人体关键点检测识别技术已有一定的发展,但是还需要对其进行改进,以更好地满足在体育领域中动作规范性判断和动作计数的需求。这将为体育教育和体育竞技领域带来更规范、智能的操作和管理,推动体育教育和体育竞技的发展和提升。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
王国华  叶晓潼  叶安琪  肖光成  吴秉钊  甄佩盈  郑永森
技术所属: 华南农业大学
相关技术
变压器呼吸器变色检测方法、装置、系统及电子设备 变压器呼吸器变色检测方法、装置、系统及电子设备
基于机器视觉和AR的虫害检测与管理系统 基于机器视觉和AR的虫害检测与管理系统
一种电路板的故障快速检测方法、系统及存储介质 一种电路板的故障快速检测方法、系统及存储介质
遥感影像检测方法、装置、电子设备及存储介质 遥感影像检测方法、装置、电子设备及存储介质
一种基于在网计算的流表压缩方法 一种基于在网计算的流表压缩方法
一种基于分段信道估计的通感一体化系统干扰消除方法 一种基于分段信道估计的通感一体化系统干扰消除方法
一种基于上半身姿态的驾驶员情绪状态检测方法及系统 一种基于上半身姿态的驾驶员情绪状态检测方法及系统
一种引入RBU的轻量化皮革表面缺陷显著目标检测方法 一种引入RBU的轻量化皮革表面缺陷显著目标检测方法
一种基于金字塔的SAR图像相干斑抑制方法 一种基于金字塔的SAR图像相干斑抑制方法
一种考虑多层级特征的多类别点云异常检测方法及系统 一种考虑多层级特征的多类别点云异常检测方法及系统
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利