多尺度(multi-scale)目标检测方法
多尺度图像预测将图片进行不同尺度的缩放,得到图像金字塔,如果对每层图片提取不同尺度的特征,得到特征图。最后对每个尺度的特征都进行单独的预测。特点:不同的尺度的特征都可以包含很丰富的语义信息,精度高,但是速度慢。2.金字塔特征预测将输入的图片转变成feature map,在feature map层面上来进行尺度变换,采用不同的方法进行不同尺度特征的融合,以实现多尺度检测。2.1 FPN特征金字塔网络
·
1.多尺度图像预测
将图片进行不同尺度的缩放,得到图像金字塔,如果对每层图片提取不同尺度的特征,得到特征图。最后对每个尺度的特征都进行单独的预测。
特点:不同的尺度的特征都可以包含很丰富的语义信息,精度高,但是速度慢。
2.金字塔特征预测
将输入的图片转变成feature map,在feature map层面上来进行尺度变换,采用不同的方法进行不同尺度特征的融合,以实现多尺度检测。
2.1 FPN
特征金字塔网络:将低层的特征和高层的特征融合起来,在不同的特征层进行预测。
2.2 SSD
从网络不同层抽取不同尺度的特征,然后在这不同尺度的特征上分别进行预测。低层对小物体检测比较有效。
3.bounding box设计
利用rpn网络生成不同尺度的anchor,实现多尺度目标检测。faster RCNN和SDD都用到这方法。
faster rcnn中 RPN 从单个feature map上面预测,是二分类(是|不是目标);SSD中 RPN从多个特征图上面预测,是(N+1)分类(N个类别+1个背景)。
更多推荐
所有评论(0)