lightx2v/Self-Forcing-FP8

lightx2v

Texto a video

Checkpoint FP8 de la familia Self-Forcing para generación de video autorregresiva eficiente a partir de texto. Está basado en Wan-AI/Wan2.1-T2V-1.3B-Diffusers y se usa mediante Diffusers para generar video o imágenes/video desde prompts descriptivos.

Como usar

Instalación y ejemplo de uso con Diffusers:
pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("lightx2v/Self-Forcing-FP8", dtype=torch.bfloat16, device_map="cuda")

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

Funcionalidades

Generación de video a partir de texto con Diffusers.
Checkpoint optimizado en FP8 dentro de la familia Self-Forcing.
Basado en Wan-AI/Wan2.1-T2V-1.3B-Diffusers.
Licencia MIT.
No está desplegado actualmente en proveedores de inferencia de Hugging Face.

Casos de uso

Crear clips o salidas visuales generadas desde prompts de texto.
Experimentar con checkpoints Self-Forcing para generación de video eficiente.
Probar un modelo derivado de Wan2.1-T2V-1.3B en flujos locales con Diffusers.