aifeifei798/ComfyUI-z_image-fp8

aifeifei798

Texto a imagen

Modelo de texto a imagen basado en Comfy-Org/z_image y preparado para uso en ComfyUI con pesos FP8, concretamente el formato E4M3FN. Está orientado a inferencia eficiente, donde la precisión dentro de un rango numérico estable es más importante que soportar valores extremos de entrenamiento.

Como usar

Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained(
    "aifeifei798/ComfyUI-z_image-fp8",
    dtype=torch.bfloat16,
    device_map="cuda"
)

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

Uso local en ComfyUI: copiar z_image-fp8-e4m3fn.safetensors a ComfyUI/models/diffusion_models.

Funcionalidades

Generación de imágenes a partir de texto mediante Diffusers.
Pesos en formato FP8 E4M3FN, adecuado para inferencia y almacenamiento compacto de pesos.
Compatible con ComfyUI copiando el archivo z_image-fp8-e4m3fn.safetensors en la carpeta de modelos de difusión.
Licencia apache-2.0.
No está desplegado actualmente en proveedores de inferencia de Hugging Face.

Casos de uso

Generar imágenes desde prompts de texto en flujos locales de ComfyUI.
Ejecutar inferencia de texto a imagen con pesos FP8 cuando se busca reducir memoria frente a formatos de mayor precisión.
Probar el modelo base z_image en aplicaciones locales como Draw Things o DiffusionBee, si el entorno soporta el formato correspondiente.