【深度学习经典网络架构—10】：注意力模块之CBAM

一、简述在[【深度学习经典网络架构—8】：注意力机制之SE_Block](https://blog.csdn.net/qq_42856191/article/details/123655146?spm=1001.2014.3001.5501)中，我们介绍了CNN的通道注意力模块SE_Block，本次带来的是另一个即用即插的注意力模块CBAM。论文链接：[CBAM: Convolutional Bl

米开朗琪罗~

7265人浏览 · 2022-03-26 07:30:00

米开朗琪罗~ · 2022-03-26 07:30:00 发布

✨博客主页：米开朗琪罗~🎈
✨博主爱好：羽毛球🏸
✨年轻人要：Living for the moment（活在当下）！💪
🏆推荐专栏：【图像处理】【千锤百炼Python】【深度学习】【排序算法】

😺一、简述

在【深度学习经典网络架构—8】：注意力机制之SE_Block中，我们介绍了CNN的通道注意力模块SE_Block，本次带来的是另一个即用即插的注意力模块CBAM。

论文链接：CBAM: Convolutional Block Attention Module

😺二、CBAM(Convolutional Block Attention Module)

CBAM的结构如下图所示：
在这里插入图片描述
由图可知，CBAM包含两个独立的子模块，分别是通道注意力模块（Channel Attention Module，CAM）和空间注意力模块（Spartial Attention Module，SAM）。

设输入特征 $F\in \mathbb{R}^{C\ast H\ast W}$ ，顺序的可以得到一维的通道注意力图 $M_{c}\in \mathbb{R}^{C\ast 1\ast 1}$ 和二维的空间注意力图 $M_{s}\in \mathbb{R}^{1\ast H\ast W}$ 。全部的注意力过程可以总结为：
$\begin{matrix}F^{'}=M_{c}(F)\otimes F \\ F^{''}=M_{s}(F^{'})\otimes F^{'} \end{matrix}$
其中 $\otimes$ 表示按元素级相乘。

🐶2.1 CAM(Channel Attention Module)

CAM如下图所示：
在这里插入图片描述
流程如下：
首先通过最大池化和平均池化得到两个 $1 \times 1 \times C$ 的特征图，然后将其送入MLP，将MLP输出的特征进行像素级的加和后再经过sigmoid激活，得到最终的通道注意力特征。

公式如下：
在这里插入图片描述

🐶2.2 SAM(Spatial Attention Module)

SAM如下图所示：
在这里插入图片描述流程如下：
将CAM作为输入，首先沿着通道维度进行最大池化和平均池化，得到两个 $H \times W \times 1$ 特征图，然后对特征图通道级联，接着经过一个 $7 \times 7$ 卷积层降维至单通道，最后经sigmoid激活得到SAM。

公式如下：
在这里插入图片描述

😺三、消融实验

作者对网络结构进行了多组消融实验，最终确认串联，通道注意在前、空间注意在后能得到更优异的效果。具体实验结果详见论文。

😺四、CBAM可视化

为了确定CBAM带来的注意强度，作者使用Grad-CAM对特征图进行激活，如下图所示：
在这里插入图片描述
可以看到，加入CBAM的ResNet50要比加入SE_Block的具有更强的表达能力。

😺五、总结

CBAM作为一种联合了通道与空间的注意力模块，不仅加强了网络的特征表达能力，而且足够轻量化，在许多网络中都可以即插即用。

技术共进，成长同行——讯飞AI开发者社区

更多推荐

机器学习与人工智能

python# 创建基类# 定义一对多关系# 定义多对一关系# 定义多对多关系（通过关联表）# 关联表（用于多对多关系）SQLAlchemy ORM提供了强大而灵活的数据库操作方式，通过本文的介绍，您应该能够：安装和配置SQLAlchemy定义数据模型和关系执行基本的CRUD操作构建复杂查询管理数据库事务遵循最佳实践SQLAlchemy还有更多高级特性，如混合属性、事件监听、自定义查询等，值得进一

讯飞AI开发者社区

C++与人工智能框架

重新排列范围，使得指定位置的元素等于排序后的元素，并且左边的元素都不大于它，右边的元素都不小于它。算法的原理是 “覆盖” 要删除的元素，将保留的元素移到前面，返回新的逻辑尾迭代器，但。对范围内的每个元素应用一个函数，并将结果存储在另一个范围内。移除范围内连续的重复元素，返回新的逻辑结尾迭代器。旋转范围内的元素，使中间元素成为新的第一个元素。这些算法不会改变它们所操作的容器中的元素。这些算法会修改它