Stable Diffusion是开源的,你可以免费使用,Midjourney是一个部署在Discord上的商业化产品,免费注册用户只有25次使用限制,之后需要按月或者按年订阅付费才能继续使用。(并且需要科学上网)
Stable Diffusion是一种扩散模型(diffusion model)的变体,叫做“潜在扩散模型”(latent diffusion model; LDM)。扩散模型是在2015年推出的,其目的是消除对训练图像的连续应用高斯噪声,可以将其视为一系列去噪自编码器。Stable Diffusion由3个部分组成:变分自编码器(VAE)、U-Net和一个文本编码器。与其学习去噪图像数据,而是训练VAE将图像转换为低维潜在空间。添加和去除高斯噪声的过程被应用于这个潜在表示,然后将最终的去噪输出解码到像素空间中。在前向扩散过程中,高斯噪声被迭代地应用于压缩的潜在表征。每个去噪步骤都由一个神经网络(ResNet)中坚的U-Net架构完成,通过从前向扩散往反方向去噪而获得潜在表征。最后,VAE解码器通过将表征转换回像素空间来生成输出图像。
图1
图2
图3
图4
图5
图6
图7
图8
如果喜欢请点个关注谢谢!