aifeifei798/ComfyUI-z_image-fp8
aifeifei798
Texto a imagen
Modelo de texto a imagen basado en Comfy-Org/z_image y preparado para uso en ComfyUI con pesos FP8, concretamente el formato E4M3FN. Está orientado a inferencia eficiente, donde la precisión dentro de un rango numérico estable es más importante que soportar valores extremos de entrenamiento.
Como usar
Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline
# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained(
"aifeifei798/ComfyUI-z_image-fp8",
dtype=torch.bfloat16,
device_map="cuda"
)
prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]
Uso local en ComfyUI: copiar z_image-fp8-e4m3fn.safetensors a ComfyUI/models/diffusion_models.
Funcionalidades
- Generación de imágenes a partir de texto mediante Diffusers.
- Pesos en formato FP8 E4M3FN, adecuado para inferencia y almacenamiento compacto de pesos.
- Compatible con ComfyUI copiando el archivo z_image-fp8-e4m3fn.safetensors en la carpeta de modelos de difusión.
- Licencia apache-2.0.
- No está desplegado actualmente en proveedores de inferencia de Hugging Face.
Casos de uso
- Generar imágenes desde prompts de texto en flujos locales de ComfyUI.
- Ejecutar inferencia de texto a imagen con pesos FP8 cuando se busca reducir memoria frente a formatos de mayor precisión.
- Probar el modelo base z_image en aplicaciones locales como Draw Things o DiffusionBee, si el entorno soporta el formato correspondiente.