《南溪的目标检测学习笔记》——后处理方法的学习笔记

1 前言后处理方法是很重要的，我在学习训练COCO数据集时深有体会，这里用笔记记录一下后处理的相关知识2 常用的后处理方法后处理方式推荐的使用顺序：阈值过滤 →\rightarrow→ 按类别Top-K →\rightarrow→按类别NMS2.1 阈值过滤——最简单的后处理设置一定的阈值范围对boxes进行过滤，感觉0.5一般是不错的选择；2.2 NMS——最常用的后处理方法2.3 Top-K—

songyuc

417人浏览 · 2020-12-04 01:26:36

songyuc · 2020-12-04 01:26:36 发布

1 前言

后处理方法是很重要的，我在学习训练COCO数据集时深有体会，这里用笔记记录一下后处理的相关知识～

2 南溪使用的的后处理方法

南溪使用后处理操作流程：
阈值过滤（低阈值去框，提速nms） $\rightarrow$
（进行NMS之前目前不进行其它，因为不同框的分数不同，会影响NMS的效果）
按类别NMS（能量场效应） $\rightarrow$
按类别Top-K （提高准确率）（暂停使用，待测试） $\rightarrow$
整体Top-K（暂停使用，待测试）

2.1 阈值过滤——最简单的后处理

设置一定的阈值范围对boxes进行过滤，感觉0.5一般是不错的选择；

2.2 NMS——最常用的后处理方法

参考YOLOV4和TextBox的NMS方法；

2.3.1 NMS算法的思考

对于NMS算法来说，是基于“同类目标框重叠的可能性较小的先验信息的”，具体来说，就是bboxes之间的IoU值；

2.3.2 Simple NMS算法

Nms算法实现，已经torchvision.ops中进行了实现：
torchvision.ops.nms

2.3.3 Soft-NMS算法

Ref：PaddleDetection在CornerNet-Squeeze模型中使用了Soft-NMS算法；
Soft-NMS原始论文：《Soft-NMS – Improving Object Detection With One Line of Code》

算法分析：

原始论文中的伪代码如下
代码实现：（参考PaddleDetection-post_process-soft_nms）

def soft_nms(dets, sigma, thres):
    dets_final = []
    while len(dets) > 0:
    	# 将候选框按照得分高低降序排序
    	# Tip：np.argmax()会返回数组中最大元素的索引
        maxpos = np.argmax(dets[:, 0])
        # 将得分最高的候选框放入最终结果dets_final中
        dets_final.append(dets[maxpos].copy())
        # 获取最佳bbox的各个属性
        ts, tx1, ty1, tx2, ty2 = dets[maxpos]
        # 获得所有候选框的得分
        scores = dets[:, 0]
        # force remove bbox at maxpos
        # （通过将maxpos的score置为-1），从而将其删除
        scores[maxpos] = -1
        x1 = dets[:, 1]
        y1 = dets[:, 2]
        x2 = dets[:, 3]
        y2 = dets[:, 4]
        areas = (x2 - x1 + 1) * (y2 - y1 + 1)
        xx1 = np.maximum(tx1, x1)
        yy1 = np.maximum(ty1, y1)
        xx2 = np.minimum(tx2, x2)
        yy2 = np.minimum(ty2, y2)
        w = np.maximum(0.0, xx2 - xx1 + 1)
        h = np.maximum(0.0, yy2 - yy1 + 1)
        inter = w * h
        ovr = inter / (areas + areas[maxpos] - inter)
        weight = np.exp(-(ovr * ovr) / sigma)
        scores = scores * weight
        idx_keep = np.where(scores >= thres)
        dets[:, 0] = scores
        dets = dets[idx_keep]
    dets_final = np.array(dets_final).reshape(-1, 5)
    return dets_final

2.3.4 顶会算法学习

Weighted Boxes Fusion方法

原始论文：Weighted boxes fusion: Ensembling boxes from different object detection models
官方实现：ZFTurbo-Weighted-Boxes-Fusion

2.4 Top-K——“也还挺简单的”

2.4.1按类别top-K——“根据统计先验的处理方法”

可以按照类别对boxes进行top-K的筛选；

2.4.2 全局Top-K

（暂时不考虑使用“全局Top-K”，这个方法的物理含义还不是很明显）

3 阈值的超参数搜索

Conf的取值范围： $(0.25, 0.95), s t r i d e = 0.05$
搜索次数： $15\times15=225\text{次}$
搜索方法：网格搜索

技术共进，成长同行——讯飞AI开发者社区

更多推荐

AI辅助编程中的审查疏漏：灾难性后果深度解析

不要依赖AI的逻辑和代码，要指导AI思考和给出代码并进行严格的审查和测试，否则其灾难性后果将是你我不可承受之重！随着生成式人工智能（AI）技术的飞速发展，AI辅助编程已成为软件开发领域不可逆转的趋势。然而，这一技术变革在带来效率提升的同时，也伴随着前所未有的风险。当人类开发者对AI生成代码的输出缺乏严格、审慎的审查时，一系列灾难性的后果便可能发生。这些后果不仅限于代码级别的缺陷，更可能演变为严重的

讯飞AI开发者社区

AI加持的“vibe hacking”氛围黑客

Vibe Hacking（氛围黑客）的技术本质在于以人工智能为核心驱动力，通过自然语言意图描述实现网络攻击全流程自动化。作为Vibe Coding（氛围编程）与恶意AI模型结合的产物，其核心机制是攻击者无需掌握编程技术，仅通过精准描述攻击意图（Prompt），即可使AI生成恶意代码、执行侦察、窃取数据、定制勒索策略并完成攻击闭环。