【DDPM论文解读】Denoising Diffusion Probabilistic Models

news/2024/7/20 17:40:00 标签: 人工智能, 图像生成, AIGC, 大模型

在这里插入图片描述

0 摘要

本文使用扩散概率模型合成了高质量的图像结果,扩散概率模型是一类受非平衡热力学启发的潜变量模型。本文最佳结果是通过根据扩散概率模型和朗之万动力学的去噪分数匹配之间的新颖联系设计的加权变分界进行训练来获得的,并且本文的模型自然地承认渐进式有损解压缩方案,该方案可以解释为自回归解码的推广。在CIFAR10 数据集上,本文都获得了不错的分数。

本文github链接:https://github.com/hojonathanho/diffusion.

论文连接:https://arxiv.org/abs/2006.11239

1 引言

各种深度生成模型最近在各种数据模式中展示了高质量的样本。生成对抗网络(GAN)、自回归模型、 flows 和变分自动编码器(VAE)合成了引人注目的图像和音频样本,并且基于能量的建模和评分匹配取得了显着的进步,产生了与 GAN 相当的图像。

在这里插入图片描述

扩散概率模型是使用变分推理训练的参数化马尔可夫链,以在有限时间后生成与数据匹配的样本。该链的转换被学习以逆转扩散过程,这是一个马尔可夫链,在采样的相反方向上逐渐向数据添加噪声,直到信号被破坏。当扩散包含少量高斯噪声时,将采样链转换设置为条件高斯就足够了,从而允许特别简单的神经网络参数化。
在这里插入图片描述
本文表明扩散模型能够产生高质量的样本,有时比在其他类型的生成模型上生成的结果更好。此外,本文还证明了扩散模型的某种参数化与训练过程中多个噪声水平上的去噪分数匹配采样过程中的退火朗之万动力学等价。本文使用这个参数获得了最好的样本质量结果,所以本文认为这个等价性是本文的主要贡献之一。

本文表明扩散模型的采样过程是一种渐进式解码,它类似于自回归解码的比特排序,极大地扩展了自回归模型通常可以实现的功能。

2 训练与推理

在这里插入图片描述
训练过程,其实就是不断迭代得到最佳的参数,来使推到得到的目标损失函数最小:
在这里插入图片描述
目标函数的物理意义直观理解就是:让模型输出和随机生成的噪音 距离差值最小。我们的模型的目标其实就是在生成噪音。更准确的说是在生成真实信号与标准高斯分布噪音之间多余的那部分噪音信号,我们可以通过用 标准高斯分布噪音 减去 生成的噪音信号 得到我们最后的 合成信号。

Inference 也就是上面算法右图中的Sampling 过程:用 上一轮输出的带噪音信号减去模型生成的噪音信号乘上一个系数,而第一轮的输入就是一个完完全全的标准高斯分布噪音。

3 实验

表 1 显示了 CIFAR10 的 IS 分数、FID 分数和负对数似然值(无损编码长度)。我们的 FID 得分为3.17,与文献中的大多数模型(包括类条件模型)相比,我们的无条件模型达到了更好的样本质量。按照标准做法,我们的 FID 分数是针对训练集计算的;当我们针对测试集计算时,分数为 5.24,仍然优于许多文献中的训练集 FID 分数。
在这里插入图片描述

Inception Score(IS)和Fréchet Inception Distance(FID)是用于衡量深度学习生成模型生成图像质量的指标。

  • IS结合了两个方面的评估:图像质量的期望值(Exp)和图像质量分布的分歧度(KL)
  • FID通过比较生成图像和真实图像在特征空间中的分布距离来衡量它们之间的差异,具体而言,FID使用了真实图像和生成图像在Inception网络的中间层的特征向量上的统计特性。

指标详细参考:https://www.zhihu.com/search?type=content&q=Inception%20scores

在这里插入图片描述

4 结论

本文利用扩散模型生成了高质量的图像样本,并发现了扩散模型与马尔可夫链训练的变分推理、去噪分数匹配和退火朗格文动力学(以及基于能量的扩展模型)、自回归模型和渐进有损压缩之间的联系。由于扩散模型似乎对图像数据具有极佳的归纳偏差,我们期待着研究它们在其他数据模式中的用途,以及作为其他类型生成模型和机器学习系统的组成部分。


http://www.niftyadmin.cn/n/5046077.html

相关文章

PCA9306——I2C电平转换模块

PCA930——I2C电平转换 PCA9306是双向I2C总线和SMBus电压电平转换器,具有启用(EN)输入,可从1.0 V到3.6 V和1.8 V到5.5V的电平转换。 PCA9306允许在1.0 V和5V之间的双向电压转换,而不使用方向引脚。开关的低接通状态电…

[数据库]数据管理技术的发展阶段

1.人工管理阶段 20世纪50年代中期以前,计算机硬件外存没有磁盘,软件没有操作系统,没有专门管理数据的软件,数据处理方式是批处理。 数据管理特点: 数据面向应用数据不保存数据不共享不具有数据独立性 2.文件系统阶段…

均匀辐照度和局部遮光条件下光伏系统的新型样条-MPPT技术(Simulink)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

将强化学习引入NLP:原理、技术和代码实现

目录 1. 强化学习简介1.1 什么是强化学习?1.2 强化学习的核心组件1.2.1 智能体 (Agent)1.2.2 状态 (State)1.2.3 动作 (Action)1.2.4 奖励 (Reward) 2. 强化学习与NLP的结合2.1 为什么在NLP中使用强化学习?2.2 强化学习在NLP中的应用场景2.2.1 对话系统2…

EXTI外部中断

中断系统介绍 • 中断:在主程序运行过程中,出现了特定的中断触发条件(中断源),使得 CPU 暂停当前正在运行的程序,转而去处理中断程序,处理完成后又返回原来被暂停的位置继续运行 • • 中断优先…

以太网协议

以太网 以太网协议格式🎨目的地址,源地址mac地址格式 以太网协议格式🎨 目的地址,源地址 此处的地址,叫做mac地址(物理地址),长度是6个字节 mac地址的作用也是用来区分不同的主机 IP地址的长度是4字节 IP地址负责网络层(整体)转发,mac地址负责数据链路层…

kafka rabbitmq 详细对比

Kafka & rabbitmq kafka Producer:消息生产者,将消息 push 到 Kafka 集群中的 Broker。 Consumer:消息消费者,从 Kafka 集群中 pull 消息,消费消息。 Consumer Group:组团消费,每个 Con…

使用windows schtasks开机批量启动常用软件

文章目录 1.schtasks简介2.schtasks增删查3. 脚本——开机批量启动常用软件 1.schtasks简介 windows的定时任务管理,相当于Linux的crontask 2.schtasks增删查 # 增 schtasks.exe /create /tn "startAll" /ru SYSTEM /sc ONSTART /tr "C:\init.bat…