stable diffusion系列（1）------概述

讲最经典的DDPM。

溯源006

616人浏览 · 2024-10-13 21:38:28

溯源006 · 2024-10-13 21:38:28 发布

本文是对李宏毅老师的课程的总结，B站链接如下：
stable diffusion(1)概述
讲最经典的DDPM。

1. DDPM图像生成是一个多个step的去噪过程

DDPM是一个从噪声图像中通过不断去噪（经过很多个step），生成图像的过程。
“雕像本来就已经存在石头里，只是把多余的去掉。”
在这里插入图片描述
问题是，这么多个step用的是同一个去噪模型吗？是的！！！但是不同的step含有的噪声大小是不一样的，所以，去噪模型还需要知道是哪个step（噪声的大小程度）。

2. 去噪模型内部机制

（1）有一个噪声预测模型(Noise Predicter)，输入时带有噪声的图片和当前的step代号，输出是该图片含有的噪声
（2）带有噪声的图片减去预测的噪声
在这里插入图片描述

3. 如何训练这个噪声预测模型？

这个训练过程肯定需要当前这个step的噪声作为ground truth
在这里插入图片描述
这个ground truth其实是自己加的。这需要一个前向加噪的过程（扩散过程）。

4. 把文本加进来

需要图像文本对，LAION图像文本对5.85B

在这里插入图片描述
把文本输入到去噪模型中，让模型根据文本去噪。

把文本输入到去噪模型中，实际上也就是输入到噪声预测模型中.

技术共进，成长同行——讯飞AI开发者社区

技术共进，成长同行——讯飞AI开发者社区

更多推荐

cover

深度学习算法：开启智能时代的钥匙

讯飞AI开发者社区

cover

目标检测数据集第017期-基于yolo标注格式的垃圾分类检测数据集(含免费分享)

讯飞AI开发者社区

cover

【论文阅读】Security of Language Models for Code: A Systematic Literature Review

讯飞AI开发者社区

所有评论(0)

查看更多评论

溯源006

已为社区贡献7条内容