stabilityai
/

sd-vae-ft-ema-original

Text-to-Image

stable-diffusion

stable-diffusion-diffusers

Model card Files Files and versions Community

multimodalart HF staff commited on Oct 13, 2022

Commit

fda49c0

•

1 Parent(s): b7e7887

Update README.md

Browse files

Files changed (1) hide show

README.md +27 -19

README.md CHANGED Viewed

@@ -1,3 +1,11 @@
 # Improved Autoencoders
 ## Decoder Finetuning
 We publish two kl-f8 autoencoder versions, finetuned from the original [kl-f8 autoencoder](https://github.com/CompVis/latent-diffusion#pretrained-autoencoding-models).
@@ -33,41 +41,41 @@ _Visualization of reconstructions on  256x256 images from the COCO2017 validatio
 <p align="center">
   <br>
   <b>
-256x256: ft-MSE (left), ft-EMA (middle), original (right)</b>
 </p>
 <p align="center">
-<img src=eval/ae-decoder-tuning-reconstructions/ft-mse/00025.png />
-<img src=eval/ae-decoder-tuning-reconstructions/ft-ema/00025.png />
-<img src=eval/ae-decoder-tuning-reconstructions/original/00025.png />
 </p>
 <p align="center">
-<img src=eval/ae-decoder-tuning-reconstructions/ft-mse/00011.png />
-<img src=eval/ae-decoder-tuning-reconstructions/ft-ema/00011.png />
-<img src=eval/ae-decoder-tuning-reconstructions/original/00011.png />
 </p>
 <p align="center">
-<img src=eval/ae-decoder-tuning-reconstructions/ft-mse/00037.png />
-<img src=eval/ae-decoder-tuning-reconstructions/ft-ema/00037.png />
-<img src=eval/ae-decoder-tuning-reconstructions/original/00037.png />
 </p>
 <p align="center">
-<img src=eval/ae-decoder-tuning-reconstructions/ft-mse/00043.png />
-<img src=eval/ae-decoder-tuning-reconstructions/ft-ema/00043.png />
-<img src=eval/ae-decoder-tuning-reconstructions/original/00043.png />
 </p>
 <p align="center">
-<img src=eval/ae-decoder-tuning-reconstructions/ft-mse/00053.png />
-<img src=eval/ae-decoder-tuning-reconstructions/ft-ema/00053.png />
-<img src=eval/ae-decoder-tuning-reconstructions/original/00053.png />
 </p>
 <p align="center">
-<img src=eval/ae-decoder-tuning-reconstructions/ft-mse/00029.png />
-<img src=eval/ae-decoder-tuning-reconstructions/ft-ema/00029.png />
-<img src=eval/ae-decoder-tuning-reconstructions/original/00029.png />
 </p>

+---
+license: creativeml-openrail-m
+tags:
+- stable-diffusion
+- stable-diffusion-diffusers
+- text-to-image
+inference: false
+---
 # Improved Autoencoders
 ## Decoder Finetuning
 We publish two kl-f8 autoencoder versions, finetuned from the original [kl-f8 autoencoder](https://github.com/CompVis/latent-diffusion#pretrained-autoencoding-models).
 <p align="center">
   <br>
   <b>
+256x256: ft-MSE (top), ft-EMA (middle), original (right)</b>
 </p>
 <p align="center">
+<img src="https://huggingface.co/stabilityai/stable-diffusion-decoder-finetune/resolve/main/eval/ae-decoder-tuning-reconstructions/ft-mse/00025.png" />
+<img src="https://huggingface.co/stabilityai/stable-diffusion-decoder-finetune/resolve/main/eval/ae-decoder-tuning-reconstructions/ft-ema/00025.png" />
+<img src="https://huggingface.co/stabilityai/stable-diffusion-decoder-finetune/resolve/main/eval/ae-decoder-tuning-reconstructions/original/00025.png" />
 </p>
 <p align="center">
+<img src="https://huggingface.co/stabilityai/stable-diffusion-decoder-finetune/resolve/main/eval/ae-decoder-tuning-reconstructions/ft-mse/00011.png" />
+<img src="https://huggingface.co/stabilityai/stable-diffusion-decoder-finetune/resolve/main/eval/ae-decoder-tuning-reconstructions/ft-ema/00011.png" />
+<img src="https://huggingface.co/stabilityai/stable-diffusion-decoder-finetune/resolve/main/eval/ae-decoder-tuning-reconstructions/original/00011.png" />
 </p>
 <p align="center">
+<img src=https://huggingface.co/stabilityai/stable-diffusion-decoder-finetune/resolve/main/eval/ae-decoder-tuning-reconstructions/ft-mse/00037.png />
+<img src=https://huggingface.co/stabilityai/stable-diffusion-decoder-finetune/resolve/main/eval/ae-decoder-tuning-reconstructions/ft-ema/00037.png />
+<img src=https://huggingface.co/stabilityai/stable-diffusion-decoder-finetune/resolve/main/eval/ae-decoder-tuning-reconstructions/original/00037.png />
 </p>
 <p align="center">
+<img src=https://huggingface.co/stabilityai/stable-diffusion-decoder-finetune/resolve/main/eval/ae-decoder-tuning-reconstructions/ft-mse/00043.png />
+<img src=https://huggingface.co/stabilityai/stable-diffusion-decoder-finetune/resolve/main/eval/ae-decoder-tuning-reconstructions/ft-ema/00043.png />
+<img src=https://huggingface.co/stabilityai/stable-diffusion-decoder-finetune/resolve/main/eval/ae-decoder-tuning-reconstructions/original/00043.png />
 </p>
 <p align="center">
+<img src=https://huggingface.co/stabilityai/stable-diffusion-decoder-finetune/resolve/main/eval/ae-decoder-tuning-reconstructions/ft-mse/00053.png />
+<img src=https://huggingface.co/stabilityai/stable-diffusion-decoder-finetune/resolve/main/eval/ae-decoder-tuning-reconstructions/ft-ema/00053.png />
+<img src=https://huggingface.co/stabilityai/stable-diffusion-decoder-finetune/resolve/main/eval/ae-decoder-tuning-reconstructions/original/00053.png />
 </p>
 <p align="center">
+<img src=https://huggingface.co/stabilityai/stable-diffusion-decoder-finetune/resolve/main/eval/ae-decoder-tuning-reconstructions/ft-mse/00029.png />
+<img src=https://huggingface.co/stabilityai/stable-diffusion-decoder-finetune/resolve/main/eval/ae-decoder-tuning-reconstructions/ft-ema/00029.png />
+<img src=https://huggingface.co/stabilityai/stable-diffusion-decoder-finetune/resolve/main/eval/ae-decoder-tuning-reconstructions/original/00029.png />
 </p>