2024深度学习发论文&模型涨点之——小目标检测

目标检测经过20年的发展,已经相当成熟,但小目标检测性能差的问题至今也没有被完全解决。小目标检测的根本难点在于其覆盖范围小,检测器能感知到的信息有限。对于任意目标,他们存在于特定场景或者与特定目标共存,因此利用小目标的上下文信息,补充小目标提供的有限特征。不过在近几年间,已经有许多有效的解决方法被提出。

我整理了一些小目标检测【论文+代码】合集,需要的同学公人人人号【AI创新工场】自取。

论文精选

论文1:

Sparse Semi-DETR: Sparse Learnable Queries for Semi-Supervised Object Detection

Sparse Semi-DETR:用于半监督目标检测的稀疏可学习查询

方法

查询精炼模块(Query Refinement Module):通过融合来自背景的低级特征和从弱增强图像中提取的高级特征,增强了对象查询的质量,显著提高了对小目标和部分遮挡目标的检测能力。

可靠的伪标签过滤模块(Reliable Pseudo-Label Filtering Module):选择性地过滤出高质量的伪标签,增强了检测的准确性和一致性。

端到端半监督目标检测解决方案:通过Transformer-based模型实现,无需传统组件如NMS。

图片

创新点

查询精炼模块:通过融合低级和高级特征,显著提高了小目标和部分遮挡目标的检测能力,提升了模型性能。

可靠的伪标签过滤模块:通过减少低质量伪标签的影响,进一步提高了检测准确性,特别是在复杂场景中。

性能提升:在MS-COCO和Pascal VOC基准测试中,Sparse Semi-DETR实现了对当前最先进方法的显著改进,例如在MS-COCO上使用ResNet-50作为骨干网络,仅使用10%的标记数据就达到了44.3 mAP,比之前的基线提高了0.8 mAP。

图片

论文2:

HIC-YOLOv5 Improved YOLOv5 for small object detection

HIC-YOLOv5:改进YOLOv5用于小目标检测

方法

额外的小目标检测头(SODH):为小目标添加了专门的预测头,提供更高分辨率的特征图以进行更好的预测。

通道特征融合与involution(CFFI)块:在骨干网络和颈部之间采用involution块增加特征图的通道信息。

卷积块注意力模块(CBAM):在骨干网络的末端应用CBAM,以减少计算成本,同时强调通道和空间域中的重要信息。

图片

创新点

附加预测头:通过在更高分辨率的特征图上检测小目标,提高了小目标的检测精度。

内卷块(involution block):通过增加特征图的通道信息,增强了模型的特征表达能力。

CBAM注意力机制:通过在骨干网络末端强调重要信息,降低了计算成本,同时提高了特征提取的效率和准确性。

性能提升:实验结果表明,HIC-YOLOv5在VisDrone-2019-DET数据集上提高了YOLOv5的性能,mAP@[.5:.95]提高了6.42%,mAP@0.5提高了9.38%。

图片

论文3:

UAV-YOLOv8: A Small-Object-Detection Model Based on Improved YOLOv8 for UAV Aerial Photography Scenarios

UAV-YOLOv8:基于改进YOLOv8的无人机航拍场景小目标检测模型

方法

Wise-IoU (WIoU) v3:作为边界框回归损失,通过智能梯度分配策略,使模型更多关注普通质量样本,提高模型的定位能力。

BiFormer注意力机制:优化背景网络,提高模型对关键信息的注意力。

Focal FasterNet block (FFNB):设计的特征处理模块,提出基于该模块的两种新的检测尺度,实现浅层特征和深层特征的全面整合。

图片

创新点

FFNB特征处理模块:通过全面融合浅层和深层特征,显著提高了模型对小目标的检测性能,减少了小目标的漏检率。

BiFormer注意力机制:通过动态稀疏注意力机制,提高了模型对特征图中关键信息的注意力,优化了模型的检测性能。

性能提升:实验结果表明,与基线模型相比,UAV-YOLOv8在参数数量更少的情况下,平均检测精度提高了7.7%,与其他主流模型相比,整体性能更佳。

图片

论文4:

A novel deep learning‐based single shot multibox detector model for object detection in optical remote sensing images

一种新型的基于深度学习的单次多框探测器模型,用于光学遥感图像中的目标检测

方法

改进的Inception网络:提出了一种改进的Inception网络来优化SSD,以增强浅层网络中小型目标的特征提取能力(FEA)。

修改的特征金字塔网络(FPN):对FPN进行了修改,以增强特征融合效果。

深度特征融合模块:设计了深度特征融合模块以提高深层网络的FEA。

候选框匹配:将提取的图像特征与不同宽高比的候选框匹配,以执行不同尺度的目标检测和定位。

图片

创新点

改进的Inception网络:通过增强浅层网络中的小目标特征提取能力,提高了模型对小目标的检测精度。

特征金字塔网络的改进:通过增强特征融合效果,提升了模型在复杂场景下的目标检测性能。

深度特征融合模块:通过提高深层网络的特征提取能力,增强了模型对目标的定位和分类能力。

性能提升:在DOTA数据集上的实验结果表明,所提出的算法在mAP@[.5:.95]上提高了6.42%,在mAP@0.5上提高了9.38%,有效改善了复杂场景中遥感目标的检测效果。

图片

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐