目标检测中NMS（非极大值抑制）原理解析

由于目标在图像中的形状和大小可能是各种各样的，所以为了能够较好地在图像中检测这些目标，通常会设计生成数量众多、长宽各异的候选边界框。但是对于一个目标检测任务来说，理想的情况是一个，所以目标只需输出一个最准确的边界框即可。

小哥谈

1703人浏览 · 2023-03-09 07:17:23

小哥谈 · 2023-03-09 07:17:23 发布

1.概念

非极大值抑制（Non-Maximum Suppression,NMS），顾名思义就是抑制不是极大值的元素，可以理解为局部最大搜索。这个局部代表的是一个邻域，邻域有两个参数可变，一是邻域的维数，二是邻域的大小。这里不讨论通用的NMS算法（参考论文《Efficient Non-Maximum Suppression》对1维和2维数据的NMS实现），而是用于目标检测中提取分数最高的窗口的。

举例：在行人检测中，滑动窗口经提取特征，经分类器分类识别后，每个窗口都会得到一个分数，但是滑动窗口会导致很多窗口与其他窗口存在包含或者大部分交叉的情况。这时就需要用到NMS来选取那些邻域里分数最高（是行人的概率最大），并且抑制那些分数低的窗口。

2.NMS在目标检测中的应用

人脸检测框重叠例子

目标检测pipline

3.NMS目的

目标检测中应用NMS算法的主要目的是消除多余（交叉重复）的窗口，找到最佳物体检测位置。

4.NMS原理

由于目标在图像中的形状和大小可能是各种各样的，所以为了能够较好地在图像中检测这些目标，通常会设计生成数量众多、长宽各异的候选边界框。但是对于一个目标检测任务来说，理想的情况是一个，所以目标只需输出一个最准确的边界框即可。

5.NMS算法实现

为了从多个候选边界框中选择一个最佳边界框，通常会使用非极大值抑制(NMS)算法，这种算法用于“抑制”置信度低的边界框并只保留置信度最高的边界框。

算法的实现过程为：

输入：候选边界框集合B(每个候选框都有一个置信度)、IoU阈值N

输出：最终的边界框集合D(初始为空集合)

1. 对集合B根据置信度进行降序排序；

2. 从集合B中选择第一个候选框(置信度最高)，把它放入集合D中并从集合B中删除；

3. 遍历集合B中的每个候选框，计算它们与D集合中这个候选框的IoU值。如果IoU值大于阈值N，则把它从集合B中删除；

4. 重复步骤2~3直到集合B为空。

名词解释：

置信度：置信度是介于0-1（或100%）之间的数字，它描述模型认为此预测边界框包含某类别目标的概率。

IoU（Intersection over Union，IoU）：即两个边界框相交面积与相并面积的比值，边界框的准确度可以用IoU进行表示；一般约定，在检测中，IOU>0.5，则认为检测正确，一般阈值设为0.5。

总结就是置信度和IoU一起用来计算精确率

接下来，就让我们一起进入目标检测的世界吧！

技术共进，成长同行——讯飞AI开发者社区

技术共进，成长同行——讯飞AI开发者社区

更多推荐

cover

【人工智能通识专栏】第五讲：DeepSeek插件

讯飞AI开发者社区

cover

【人工智能】提示词进阶：用“思维链（CoT）”让大模型更擅长逻辑推理

讯飞AI开发者社区

D.20.10.01-人工智能与AI实践

人工智能（AI）是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。随着大语言模型的崛起，AI正从感知智能向认知智能迈进，其核心目标是让机器能够胜任一些通常需要人类智能才能完成的复杂工作，并具备推理、创造和决策能力。

讯飞AI开发者社区

所有评论(0)

查看更多评论

小哥谈

@weixin_61961691

已为社区贡献3条内容