1.多尺度图像预测
将图片进行不同尺度的缩放,得到图像金字塔,如果对每层图片提取不同尺度的特征,得到特征图。最后对每个尺度的特征都进行单独的预测。
特点:不同的尺度的特征都可以包含很丰富的语义信息,精度高,但是速度慢。

2.金字塔特征预测
将输入的图片转变成feature map,在feature map层面上来进行尺度变换,采用不同的方法进行不同尺度特征的融合,以实现多尺度检测。

2.1 FPN
特征金字塔网络:将低层的特征和高层的特征融合起来,在不同的特征层进行预测。
2.2 SSD
从网络不同层抽取不同尺度的特征,然后在这不同尺度的特征上分别进行预测。低层对小物体检测比较有效。

3.bounding box设计
利用rpn网络生成不同尺度的anchor,实现多尺度目标检测。faster RCNN和SDD都用到这方法。

faster rcnn中 RPN 从单个feature map上面预测,是二分类(是|不是目标);SSD中 RPN从多个特征图上面预测,是(N+1)分类(N个类别+1个背景)。
在这里插入图片描述

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐