Learning to Generalize:Meta-Learning for Domain Geralization 深度理解（公式详细推导，包含二阶导）

Learning to Generalize:Meta-Learning for Domain Geralization 深度理解

dailleson_

2668人浏览 · 2020-09-21 10:03:53

dailleson_ · 2020-09-21 10:03:53 发布

1.算法整体流程

输入：训练域为: $S$

初始化：模型参数 $θ\theta$ ,学习率： $β,γ\beta,\gamma$

for ite in iterations do

Split: $Sˉ\bar{S}$ and $Sˇ\check{S}$ $→\rightarrow$ $S$

Meta-train:

Gradients $∇θ1=Fθ′(Sˉ;θ)\nabla_{\theta_1}=\mathcal{F^{'}_\theta}(\bar{S};\theta)$

Updated parameters $θ′=θ−β∇θ1\theta^{'}=\theta-\beta\nabla_{\theta_1}$

Meta-test:

Loss is $G(Sˇ;θ′)\mathcal{G}(\check{S};\theta^{'})$

Gradients Update $θ:\theta:$
$∇θ2=dG(Sˇ;θ′)dθ=dG(Sˇ;θ−β∇θ1)dθ′dθ′dθ=Gθ′′(Sˇ;θ−β∇θ1)d(θ−β∇θ1)dθ=Gθ′′(Sˇ;θ−β∇θ1)(1−βd∇θ1dθ)\nabla_{\theta_2}=\frac{d\mathcal{G}(\check{S};\theta^{'})}{d\theta}=\frac{d\mathcal{G}(\check{S};\theta-\beta\nabla_{\theta_1})}{d\theta^{'}}\frac{d\theta^{'}}{d\theta}=\mathcal{G^{'}_{\theta^{'}}}(\check{S};\theta-\beta\nabla_{\theta_1})\frac{d(\theta-\beta\nabla_{\theta_1})}{d\theta}=\mathcal{G^{'}_{\theta^{'}}}(\check{S};\theta-\beta\nabla_{\theta_1})(1-\beta\frac{d\nabla_{\theta_1}}{d\theta})$

Meta-optimization: Update $θ:csdn在线markdnow的latex不支持begin{align}标签，贴图如下\theta:{\color{Red}csdn在线markdnow的latex不支持begin\{align\}标签，贴图如下}$
在这里插入图片描述

2.总结

MLDG是第一篇将meta learning引入domain generalization的论文。在这篇论文中， $G(;)=F(;)=CrossEntropy\mathcal{G}(;)=\mathcal{F}(;)=CrossEntropy$ ，二阶导几乎不起作用，训练模型的时候可以将代码中二阶导计算关掉(没用还很耗时)。

loss.backward(retain_graph=True, create_graph=True)
->改为
loss.backward(retain_graph=True, create_graph=False)

楼主跑过这篇文章的代码，性能与普通训练方式差不太多，即先在 $Sˉ\bar{S}$ 训练更新，然后再在 $Sˇ\check{S}$ 上训练更新。个人认为他的insight在于启发了后续的meta-dg方法，后续方法重新设计能够约束特征空间的 $G(;)\mathcal{G}(;)$ ，后续方法是否有效等楼主验证后再更新。

技术共进，成长同行——讯飞AI开发者社区

更多推荐

1747张YOLO标注奶牛水牛识别数据集：精准标注跨场景动物检测模型训练专用计算机视觉数据集，助力智慧农业与畜牧业AI算法研发

讯飞AI开发者社区

YOLOv8【卷积创新篇·第25节】Capsule Network胶囊卷积网络：让检测器拥有“空间想象力”！

讯飞AI开发者社区

机器学习与人工智能

python# 创建基类# 定义一对多关系# 定义多对一关系# 定义多对多关系（通过关联表）# 关联表（用于多对多关系）SQLAlchemy ORM提供了强大而灵活的数据库操作方式，通过本文的介绍，您应该能够：安装和配置SQLAlchemy定义数据模型和关系执行基本的CRUD操作构建复杂查询管理数据库事务遵循最佳实践SQLAlchemy还有更多高级特性，如混合属性、事件监听、自定义查询等，值得进一