本专著聚焦于塑造扩散模型(diffusion models)发展的核心原理,追溯其起源,并展示不同形式如何从共同的数学思想中演化而来。 扩散建模的起点是定义一个正向扰动过程(forward corruption process),该过程会逐步将数据转化为噪声。通过定义一系列连续的中间分布,这一正向过程将复杂的数据分布与简单的噪声分布相连接。扩散模型的核心目标是构建一个反向生成过程(reverse process),使其能够沿与正向扰动相反的方向运行,从噪声逐步还原出数据,同时复现与正向过程一致的中间分布。 我们从三种互补的视角对这一思想进行形式化阐述: * 变分视角(Variational view):受变分自编码器(VAE)的启发,将扩散过程视为逐步去噪的学习过程。模型通过一系列小的去噪目标(denoising objectives)学习如何一步步将噪声还原为数据。 * 基于得分的视角(Score-based view):源于能量模型(energy-based modeling),学习数据分布随时间演化的梯度,即“得分函数(score function)”,用于指示样本应朝哪些方向调整以进入更高概率区域。 * 基于流的视角(Flow-based view):与归一化流(normalizing flows)相关,将生成视为沿着由学习到的速度场(velocity field)控制的平滑路径,从噪声平滑地迁移至数据。

这三种视角共享一个共同的数学骨架:一个随时间变化的学习速度场(time-dependent velocity field),其流动将简单的先验分布传输到目标数据分布。在此基础上,采样过程可以被视为求解一个微分方程,使噪声沿着连续的生成轨迹演化为数据。 在此理论框架之上,专著进一步讨论了: * 可控生成的引导机制(guidance for controllable generation); * 高效采样的高级数值求解方法(advanced numerical solvers for efficient sampling); * 受扩散启发的流映射模型(diffusion-motivated flow-map models),这些模型能够直接学习生成轨迹上任意时刻之间的映射。

本书面向具有基础深度学习背景的读者,旨在提供一个清晰、概念化且数学上扎实的扩散模型理解框架。它系统阐明了扩散模型的理论基础,解释了不同公式化形式背后的思想逻辑,并为进一步研究提供稳固的理论支点。该专著既可作为研究者的系统参考资料,也可作为初学者进入这一快速发展的研究领域的易懂入门读物。

成为VIP会员查看完整内容
0

相关内容

扩散模型是近年来快速发展并得到广泛关注的生成模型。它通过一系列的加噪和去噪过程,在复杂的图像分布和高斯分布之间建立联系,使得模型最终能将随机采样的高斯噪声逐步去噪得到一张图像。
【新书】共形预测的理论基础,179页pdf
专知会员服务
44+阅读 · 2024年11月20日
【简明书】扩散模型在图像和视觉领域的教程,51页pdf
专知会员服务
58+阅读 · 2024年3月29日
【2023新书】流程系统工程的高级优化,206页pdf
专知会员服务
65+阅读 · 2023年9月25日
【2023新书】合作博弈论的计算方面,170页pdf
专知会员服务
70+阅读 · 2023年6月29日
【新书】感知和行动的贝叶斯模型,348页pdf
专知会员服务
75+阅读 · 2021年11月18日
【经典书】模式识别概率理论,654页pdf
专知会员服务
87+阅读 · 2021年1月21日
最新《非凸优化理论》进展书册,79页pdf
专知会员服务
111+阅读 · 2020年12月18日
最新《机器学习:基本原理》2021新书,209页pdf
专知会员服务
134+阅读 · 2020年10月24日
新书《面向机器学习和数据分析的特征工程》,419页pdf
专知会员服务
144+阅读 · 2019年10月10日
【干货书】计算机科学离散数学,627页pdf
专知
64+阅读 · 2020年8月31日
【干货书】贝叶斯推断随机过程,449页pdf
专知
29+阅读 · 2020年8月27日
国家自然科学基金
8+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
A Survey of Large Language Models
Arxiv
486+阅读 · 2023年3月31日
Arxiv
80+阅读 · 2023年3月26日
Arxiv
25+阅读 · 2023年3月17日
VIP会员
相关VIP内容
【新书】共形预测的理论基础,179页pdf
专知会员服务
44+阅读 · 2024年11月20日
【简明书】扩散模型在图像和视觉领域的教程,51页pdf
专知会员服务
58+阅读 · 2024年3月29日
【2023新书】流程系统工程的高级优化,206页pdf
专知会员服务
65+阅读 · 2023年9月25日
【2023新书】合作博弈论的计算方面,170页pdf
专知会员服务
70+阅读 · 2023年6月29日
【新书】感知和行动的贝叶斯模型,348页pdf
专知会员服务
75+阅读 · 2021年11月18日
【经典书】模式识别概率理论,654页pdf
专知会员服务
87+阅读 · 2021年1月21日
最新《非凸优化理论》进展书册,79页pdf
专知会员服务
111+阅读 · 2020年12月18日
最新《机器学习:基本原理》2021新书,209页pdf
专知会员服务
134+阅读 · 2020年10月24日
新书《面向机器学习和数据分析的特征工程》,419页pdf
专知会员服务
144+阅读 · 2019年10月10日
相关基金
国家自然科学基金
8+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
微信扫码咨询专知VIP会员