type
status
date
slug
summary
tags
category
icon
password

Diffusion Schrödinger Bridge (DSB) vs. Diffusion Model (DM)

Diffusion Schrödinger Bridge (DSB) 和 Diffusion Model (DM) 都是基于扩散过程(diffusion process)的生成模型,但它们的数学基础、目标以及实现方式有所不同。下面我们详细分析它们的关系和区别。

1. Diffusion Model (DM)

📌 1.1 基本概念

Diffusion Model(扩散模型)是一种概率生成模型,其核心思想是:
  • 前向扩散(Forward Process):将数据逐步添加噪声,最终接近一个高斯分布。
  • 逆向扩散(Reverse Process):从噪声数据逐步去噪,恢复真实数据。

📌 1.2 公式

前向扩散过程:
其中:
  • 表示时间 t 时刻的数据状态。
  • 是噪声的步长参数。
逆向扩散过程:
其中 由神经网络(如 U-Net)学习。

📌 1.3 主要目标

  • 学习数据分布:通过去噪过程,从噪声生成高质量样本。
  • 基于分数匹配(Score Matching):学习数据分布的梯度(score function)。
  • 优化目标:通常采用**变分下界(ELBO)**来优化。

2. Diffusion Schrödinger Bridge (DSB)

📌 2.1 基本概念

Diffusion Schrödinger Bridge(扩散薛定谔桥)是一种用于概率流匹配(probability flow matching)的方法,可以看作是最优传输(Optimal Transport, OT)的一种推广
它的目标是:
  • 在给定初始分布 和目标分布 的情况下,找到连接两者的最优随机过程
  • 最优传输路径:最小化两个分布之间的 Wasserstein 距离,同时保持扩散过程的结构。

📌 2.2 公式

DSB 依赖于 Schrödinger Bridge(SB)问题,它的核心是求解以下最优控制问题
其中:
  • 是一个布朗运动或其他参考扩散过程。
  • 是连接 的最优扩散路径。
DSB 通过迭代求解 Fokker-Planck 方程 来找到最优路径:
其中 是最优漂移场(optimal drift field)。

📌 2.3 主要目标

  • 最优传输(Optimal Transport, OT):保证数据从 的最优流动。
  • 更高效的采样:相比 Diffusion Model,DSB 采样速度更快,因为它不依赖长时间步的逆向扩散。

3. Diffusion Model vs. Diffusion Schrödinger Bridge

📊 主要区别

特性
Diffusion Model (DM)
Diffusion Schrödinger Bridge (DSB)
数学基础
变分推理(Variational Inference)
最优传输(Optimal Transport)
目标
从噪声恢复数据(去噪)
计算最优概率流
前向过程
逐步加入噪声
通过最优传输找到平滑路径
逆向过程
逐步去噪(基于分数匹配)
直接找到最优路径
采样效率
需要较多时间步(通常 1000 步)
采样更快(更少的时间步)
应用领域
图像生成、文本生成
物理建模、仿真、概率流匹配

4. 关系 & 直观理解

  • DSB 可以看作是 Diffusion Model 的一种推广,它提供了一种更高效的方式来学习数据分布的最优传输路径
  • Diffusion Model 依赖于固定的前向扩散过程(加入噪声),然后训练神经网络去逆向恢复数据。
  • DSB 直接优化整个路径,使得数据在时间维度上流动得更自然,因此可以减少采样步骤,提高生成效率。

5. 直观例子

🎨 Diffusion Model(DM)
想象你在画一幅画,你首先用模糊的草图(噪声)开始,然后一步步修改它,直到变成完整的图像。这需要很多步,因为你从无序状态一步步修正。
🚗 Diffusion Schrödinger Bridge(DSB)
想象你要从 A 城市 开车到 B 城市,你希望找到最短、最平滑的路线。DSB 直接计算出这条路径,而不是像 DM 那样随机试探。

6. 总结

  • Diffusion Model 适用于生成任务,如图像、文本合成,但采样速度较慢。
  • Diffusion Schrödinger Bridge 适用于最优传输问题,能更快地找到从一个分布到另一个分布的最优路径。
  • DSB 提供了一种更高效的采样方式,可能在未来改进 Diffusion Model 的采样效率。

【ML】队列数据 Cohort DataCross Domain Skeleton-based Action Recognition by Using Parameter-free Similarity Matching
Loading...