扩散模型笔记（pytorch实现）

逆扩散过程就是从噪声中恢复图像，当模型学会从噪声中恢复图像后，给定噪声数据，模型也能够由噪声生成图像。因此，推理时只包括逆扩散过程。扩散过程就是向样本图像中逐步添加噪声，学习如何将图像扩散为噪声。：从真实数据分布中采样得到的数据，可以粗略得理解成样本图像。：均值为0，方差为1的正态分布噪声，经过变换后可以表示第。扩散模型可以分为扩散/前向过程和逆扩散/反向过程。次扩散时向样本数据中添加高斯噪声后得

多想常做

615人浏览 · 2023-07-26 22:11:42

多想常做 · 2023-07-26 22:11:42 发布

论文：Denoising Diffusion Probabilistic Models
讲解视频：Probabilistic Diffusion Model概率扩散模型理论与完整PyTorch代码详细解读
视频笔记：Probabilistic Diffusion Model概率扩散模型理论与完整PyTorch代码详细解读
示例代码：

符号和公式

$x_0$ ：从真实数据分布中采样得到的数据，可以粗略得理解成样本图像。
$x_i,i =1,2,...,T$ ：第 $i$ 次扩散时向样本数据中添加高斯噪声后得到的样本。
$q (x)$ ：扩散过程中，数据 $x$ 的分布，模型中统一为高斯分布。
$q(x_t|x_{t-1})$ ：给定 $x_{t-1}$ 的前提下， $x_{t}$ 的数据分布。
$p (x)$ ：逆扩散过程中，数据 $x$ 的分布。
$z_t$ ：均值为0，方差为1的正态分布噪声，经过变换后可以表示第 $i$ 次扩散时向样本数据中添加的高斯噪声。
$q(x_t|x_{t-1})=N(x_t;\sqrt{1-\beta_t }x_{t-1},\beta_tI)$ ： $x_t$ 是以 $\sqrt{1-\beta_t }x_{t-1}$ 为均值， $\beta_t I$ 为方差的正态分布。令 $\alpha_t=1-\beta_t,\overline{\alpha}_t=\prod^T_{i=1}\alpha_i$ ,则 $x_t$ 可以写成下式：
$x_t=\sqrt{\alpha_t}x_{t-1}+\sqrt{1-\alpha_t}z_{t-1}$
将 $x_{t-1}$ 进行替换，基于正态分布叠加的规律，可以得到如下计算：
在这里插入图片描述

整体思路

扩散模型可以分为扩散/前向过程和逆扩散/反向过程。
扩散过程就是向样本图像中逐步添加噪声，学习如何将图像扩散为噪声。
逆扩散过程就是从噪声中恢复图像，当模型学会从噪声中恢复图像后，给定噪声数据，模型也能够由噪声生成图像。因此，推理时只包括逆扩散过程。

扩散过程

扩散模型和其它类型的潜空间模型的区别在于近似后验分布 $q(x_{1:T}|x_0)$ ，
扩散模型的前向过程固定在马尔科夫链上，所以具有下式：
在这里插入图片描述
前向过程根据方差表 $\beta_1,...,\beta_T$ 向数据中逐步添加高斯噪声，使 $x_t$ 成为以 $\sqrt{1-\beta_t }x_{t-1}$ 为均值， $\beta_t I$ 为方差的正态分布。即：

基于上面两个式子，可以推出 $x_T$ 和 $x_0$ 的关系，如下：
在这里插入图片描述

反向过程

反向过程被定义为马尔科夫链，初始样本为标准正态分布 $p(x_T)=N(x_T;0,I)$ 。

技术共进，成长同行——讯飞AI开发者社区

更多推荐

PHP与人工智能：结合案例与可能性探索

讯飞AI开发者社区

[论文阅读] 人工智能 + 软件工程 | 真实场景下GitHub Copilot生产力之谜：2年数据揭示客观提交无提升，开发者却直呼“好用”

讯飞AI开发者社区

上下文工程驱动智能体向通用人工智能

例如在文章开头，我们举的产品经理和工程师之间的那一段对话，一个高质量智能体，不再只是让大模型回答用户的问题，而是通过上下文工程，帮助大模型在回答前获得更加结构化的输入，包括项目状态、需求文档、任务历史、甚至团队氛围，实现大模型更好的理解当前的任务规划、团队过往的沟通隐患、对方的工作状态与担忧、文档/知识库的实时状态等等。这和我们维护我们手机上内存很像，一开始所有应用和历史信息都保留，但当手机出现运