AI 作画《NBA球星动漫头像》| 用stable diffusion生成(nba球星动漫图)

足球明星 21℃

扩散模型原理

扩散模型是一种概率模型,通过逐步去噪一个正态分布变量来学习数据分布p(x),对应于学习长度为t的固定马尔可夫链的反向过程。模型可以通过训练去噪自编码器来实现(T = 1…T),它们被训练来预测其输入的去噪变体,而是输入的噪声版本,其训练函数:

扩散模型原理方面,包括:前向的加噪和逆向的去噪;

前向的加噪:给定初始数据(比如图像),一步一步加噪得到、、···、、、···、,最后的完全是一个正太分布噪音数据。其中,每一步的加噪,不妨记为 分布表示;对应地,实际的去噪分布记为 ;

逆向的去噪(生成):一步一步去噪,得到、···、、、···、、,不妨记为 分布表示;

事实上,扩散模型的训练就是用网络(待学习参数为)预测所加的噪音变量分布。用KL散度衡量实际的去噪分布 和由网络学习的去噪分布:即。经一系列推导化简、等价为 。这里的是高斯噪声,预测网络以含噪图片作为输入,预测所添加的噪声。

即可以理解为,扩散模型的训练目标是,希望预测的噪声和真实噪声一致

NBA球星动漫头像生成

我们来测试一下当前diffusion里最著名的 stable diffusion,它的文本生成图像能力。并且输入的文本不包含任何限制或修饰,完全把想象空间交给模型!注意,加入更多的修饰词,应该效果会好些。

姚明

库里

詹姆斯

奥尼尔

乔丹

杜兰特

科比

猜您喜欢:

戳我,查看GAN的系列专辑~!一顿午饭外卖,成为CV视觉的前沿弄潮儿!最新最全100篇汇总!生成扩散模型Diffusion Models

ECCV2022 | 生成对抗网络GAN部分论文汇总

CVPR 2022 | 25+方向、最新50篇GAN论文

 ICCV 2021 | 35个主题GAN论文汇总

超110篇!CVPR 2021最全GAN论文梳理超100篇!CVPR 2020最全GAN论文梳理

拆解组新的GAN:解耦表征MixNMatch

StarGAN第2版:多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 |《计算机视觉中的数学方法》分享

《基于深度学习的表面缺陷检测方法综述》

《零样本图像分类综述: 十年进展》

《基于深度神经网络的少样本学习综述》

标签: