本技术涉及图像处理目标检测领域,具体为一种无人机小目标检测方法、电子设备及存储介质,包括:获取图像数据集,对所述图像数据集中的各图像进行预处理,所述图像数据集由无人机拍摄的图像和相应图像的小目标验证数据组成;将预处理后的图像输入网络检测模型,计算所述网络检测模型输出结果与实际小目标验证数据的损失函数,训练所述网络检测模型参数直至最优;将待检测图像输入最优检测模型,输出无人机图像小目标检测结果,所述最优检测模型指训练后将模型参数调整至最优后的网络检测模型,增强模型对小目标的定位能力以及检测能力。
背景技术
小目标检测是指在图像中检测尺寸较小的目标物体,通常这些目标的尺寸小于图像大小的1/10或者更小。这一概念在计算机视觉领域中具有重要意义,因为它涉及到多种应用场景,如安防监控、智能交通、无人机等。小目标检测的挑战在于,由于这些目标通常携带的信息较少,如纹理、形状、颜色等外观信息有限,且在图像中占用的像素数较少,经过多次下采样后小目标的分辨率进一步降低,特征信息逐步减弱,导致检测难度增大。因此,通用的目标检测器对小目标的检测精度较低。
小目标检测的意义在于它可以提高技术的应用范围,同时帮助更好地理解图像中的细节信息。小目标检测在日常生活和工业应用中具有广泛的应用,如交通监控、医学影像分析、无人机航拍等。例如,在交通监控领域,小目标检测可用于识别交通信号灯、车牌等;在医学影像分析领域,小目标检测可用于识别微小的肿瘤细胞等;在自动驾驶领域,小目标检测可用于识别微小的障碍物,以弥补激光雷达难以探测的窘况。
其中无人机小目标检测的应用场景非常广泛,例如在城市交通监控方面,无人机可以在城市上空进行巡查,通过模型检测车辆和行人,辅助交通管理;在道路安全评估方面,利用无人机捕捉道路状况,检测行人和车辆的违规行为,从而评估道路安全状况;在灾害或紧急情况下,无人机能够迅速检测受困人员和车辆,指导救援行动。但是由于无人机飞行高度不稳定,图像场广阔,无人机航拍图像中的物体呈现尺度各异,小物体多,密度大,物体之间存在遮挡现象,难以准确捕捉。以上问题给无人机航拍目标检测带来了挑战,因此准确处理无人机目标检测的各种复杂场景,具有重要的理论意义和应用价值。
目前,基于深度学习的目标检测技术主要分为两种:第一种是基于候选区域的两阶段方法,以Fast R-CNN、Faster R-CNN为代表。第二种是单阶段方法,以SSD和YOLO系列算法为代表。当前的目标检测算法通常专注于一般场景下的检测,无人机航拍图像中存在大量分布密集的小目标,由于小目标像素信息少,特征纹理模糊,复杂多样的背景环境使检测更加困难,难以达到最佳检测效果。基于CNN的目标检测方法在提取特征时往往只关注局部信息,而基于Transformer的目标检测方法有着更强的全局注意力机制,提升了目标检测精度,但同时模型参数量也比较大。因此本发明利用CNN降低Transfomer中的自注意力计算量,同时将CNN的局部特征提取能力与Transfome的全局特征提取能力相结合以增强目标检测的特征表达能力。考虑到无人机小目标的实时性检测,且纯CNN的yolo算法速度快、简单直观、泛化能力强,因此本发明以最新的yolov10为基础进行创新设计。
实现思路