Playground v2 – Modelo Estético de 1024px
Este repositorio contiene un modelo que genera imágenes altamente estéticas con una resolución de 1024x1024. Puedes usar el modelo con Diffusers de Hugging Face. Playground v2 es un modelo generativo de texto a imagen basado en difusión. El modelo fue entrenado desde cero por el equipo de investigación en Playground. Las imágenes generadas por Playground v2 son preferidas 2.5 veces más en comparación con las producidas por Stable Diffusion XL, según un estudio de usuarios de Playground. Estamos emocionados de liberar puntos de control intermedios en diferentes etapas de entrenamiento, incluyendo métricas de evaluación, para la comunidad. Esperamos que esto fomente la investigación adicional en modelos fundamentales para la generación de imágenes. Por último, introducimos un nuevo benchmark, MJHQ-30K, para la evaluación automática de la calidad estética del modelo.
Como usar
Instalar Diffusers >= 0.24.0 y algunas dependencias:
pip install transformers accelerate safetensors
Para usar el modelo, ejecuta el siguiente fragmento de código:
from diffusers import DiffusionPipeline
import torch
pipe = DiffusionPipeline.from_pretrained(
"playgroundai/playground-v2-1024px-aesthetic",
torch_dtype=torch.float16,
use_safetensors=True,
add_watermarker=False,
variant="fp16")
pipe.to("cuda")
prompt = "Astronauta en una jungla, paleta de colores fríos, colores apagados, detallado, 8k"
image = pipe(prompt=prompt, guidance_scale=3.0).images[0]
Para utilizar el modelo con software como Automatic1111 o ComfyUI puedes usar el archivo playground-v2.fp16.safetensors.
Funcionalidades
- Generación de imágenes basadas en texto con resolución 1024x1024.
- Modelo generativo de texto a imagen basado en difusión.
- Uso con Diffusers de Hugging Face.
- Las imágenes son preferidas 2.5 veces más en comparación con las de Stable Diffusion XL.
- Lanzamiento de puntos de control intermedios y métricas de evaluación.
- Nuevo benchmark MJHQ-30K para la evaluación automática de la calidad estética.
Casos de uso
- Generación de imágenes estéticas basadas en indicaciones de texto.
- Investigación en modelos fundamentales para la generación de imágenes.
- Evaluación de la calidad estética de imágenes generadas por IA.
- Aplicaciones en categorías diversas como personas y moda.