【论文解读|滑坡检测·U-Net·语义分割· 深度学习·遥感·中分辨率影像】基于双编码器 U-Net 的滑坡检测方法：融合 Sentinel-2 影像与 DEM 数据（四）

2401_89898861

742人浏览 · 2025-03-29 13:30:00

2401_89898861 · 2025-03-29 13:30:00 发布

【论文解读|滑坡检测·U-Net·语义分割· 深度学习·遥感·中分辨率影像】基于双编码器 U-Net 的滑坡检测方法：融合 Sentinel-2 影像与 DEM 数据（四）

文章目录

【论文解读|滑坡检测·U-Net·语义分割· 深度学习·遥感·中分辨率影像】基于双编码器 U-Net 的滑坡检测方法：融合 Sentinel-2 影像与 DEM 数据（四）
- 3 方法：数据预处理
- - 3.3 模型构建
  - - 3.3.1 双编码路径与特征融合
    - - 1. 双编码器架构（Dual-Encoder Architecture）
      - 2. 分层特征融合（Layer-Wise Feature Fusion）

欢迎铁子们点赞、关注、收藏！
祝大家逢考必过！逢投必中！上岸上岸上岸！upupup

大多数高校硕博生毕业要求需要参加学术会议，发表EI或者SCI检索的学术论文会议论文。详细信息可关注VX “学术会议小灵通”或参考学术信息专栏：https://blog.csdn.net/2401_89898861/article/details/145551342

论文地址：DOI 10.1007/s10346-023-02089-5

3 方法：数据预处理

3.3 模型构建

3.3.1 双编码路径与特征融合

在深度语义分割网络中，编码器（encoder）主要由卷积层（convolutional layers）、激活函数（activation functions）和池化层（pooling layers）组成。
卷积层通过线性卷积运算提取深层特征，并通过 ReLU（Rectified Linear Unit）等非线性激活函数生成特征图（feature maps）。
卷积核（convolution kernels）的参数可训练，并通过反向传播（backpropagation）进行自适应优化。
池化层用于降采样（down-sampling）以提取高级特征并降低计算复杂度，常见方法包括最大池化（max pooling）和平均池化（average pooling）。

1. 双编码器架构（Dual-Encoder Architecture）

编码路径（encoding path）由主编码器（master encoder）和辅助编码器（companion encoder）组成：

主编码器由 4 个编码块（encoder blocks）组成，第一个编码块包含两层卷积层，后续 3 个编码块均包含一层池化层和两层卷积层。
辅助编码器由 3 个编码块组成，前两个编码块均包含两层卷积层和一层池化层，第三个编码块仅包含两层卷积层。

Sentinel-2 的光学波段作为主编码器的输入，DEM 数据作为辅助编码器的输入，利用最大池化（max pooling）聚合卷积层提取的深度信息。
在这里插入图片描述

2. 分层特征融合（Layer-Wise Feature Fusion）

为了增强网络的特征表达能力与一致性，两个编码器提取的特征逐层融合：

在每个编码阶段，主编码器与辅助编码器对应编码块的特征图（feature maps）进行拼接（concatenation），并输入到主编码器的下一编码块。
该特征融合策略能够有效提升模型的判别能力。

主编码器数据流中的特征图生成过程由公式（1）进一步描述。
在这里插入图片描述

设 $δ$ 和 $ϑ$ 分别表示主编码器（master encoder）和辅助编码器（companion encoder）， $l$
为编码块的序号， $m$ 代表特征图尺寸， $d (l)$ 为第 $l$ 层输出特征图的通道数。
$H_{δ,l}∈R^{m×m×d(l)}$ 是主编码器第 $l$ 个编码器块更新的输出特征映射图；
$H_{δ,l-1}∈R^{2m×2m×d(l-1)}$ 是主编码器第 $l - 1$ 个编码器块更新的输出特征图；
$H_{ϑ,l-1}∈R^{2m×2m×d(l-1)}$ 是辅助编码器第 $l - 1$ 个编码器块更新的输出特征图；
$W_{δ,1}∈R^{d(l)×2d(l-1)}$ 和 $W_{δ,2}∈R^{d(l)×d(l)}$ 为可训练参数矩阵。
BN 代表批量归一化（batch normalization），
$σ (\cdot)$ 为激活函数（activation function）， $M a x P oo l 2 \times 2 (\cdot)$ 代表 2×2 最大池化（max pooling）操作。

辅助编码器中编码块的特征图计算公式如下：

在这里插入图片描述

$H_{ϑ,l}∈R^{m×m×d(l)}$ 是输出特征图；
$H_{ϑ,l-1}∈R^{2m×2m×d(l-1)}$ 是输入特征图；
$W_{ϑ,1}∈R^{d(l)×2d(l-1)}$ 和 $W_{ϑ,2}∈R^{d(l)×d(l)}$ 表示编码器块的卷积层的可训练参数矩阵。

除了主编码器（master encoder）和辅助编码器（companion encoder）外，编码路径与解码路径之间通过桥接模块（bridge）连接，该模块包含 最大池化层（max pooling layer）、两层卷积（convolutional layers）和上采样层（up-sample layer）。

下节请参考:【论文解读|滑坡检测·U-Net·语义分割· 深度学习·遥感·中分辨率影像】基于双编码器 U-Net 的滑坡检测方法：融合 Sentinel-2 影像与 DEM 数据（五）

欢迎铁子们点赞、关注、收藏！
祝大家逢考必过！逢投必中！上岸上岸上岸！upupup