calcuis/illustrious

calcuis
Texto a imagen

Paquete de prueba de versiones GGUF cuantizadas y versiones fp8 escaladas de Illustrious para generación de imágenes texto-a-imagen. Está basado en OnomaAIResearch/Illustrious-xl-early-release-v0, usa arquitectura SDXL y ofrece múltiples cuantizaciones para ejecutar el modelo en ComfyUI, incluido hardware antiguo o configuraciones de baja VRAM.

Como usar

Configuración general en ComfyUI:

  1. Arrastra los archivos GGUF a ./ComfyUI/models/diffusion_models.
  2. Arrastra los codificadores CLIP, por ejemplo illustrious_g_clip e illustrious_l_clip, a ./ComfyUI/models/text_encoders.
  3. Arrastra el VAE a ./ComfyUI/models/vae.

Ejecución sin instalación manual:

  1. Descarga el pack de ComfyUI que incluye el nuevo gguf-node.
  2. Ejecuta el archivo .bat en el directorio principal.

Flujo de trabajo:

  1. Arrastra cualquier archivo JSON de workflow al navegador activo de ComfyUI.
  2. También puedes arrastrar una salida generada, como una imagen o video que contenga metadatos del workflow, al navegador activo.

Ejemplo de prompt incluido en la página:

masterpiece, best quality, vibrant, very aesthetic, high contrast, semrealistic, highly detailed, absurdres, masterful composition, cinematic lighting, score_9, score_8_up, score_7_up, score_6_up, score_5_up, rating_questionable, source_anime, 1girl, portrait, multicolored hair, fringe, bare shoulders, upper body, cosmic

Prompt negativo de ejemplo:

femboy, low quality, 2koma, 4koma, bad anatomy, jpeg artifacts, signature, watermark, lowres, bad hands

Funcionalidades

Generación texto-a-imagen con arquitectura SDXL.
Distribución en formato GGUF compatible con gguf-node para ComfyUI.
Incluye variantes cuantizadas de 2, 3, 4, 5, 6 y 8 bits, además de archivos F16.
Incluye familias de archivos fast-illustrious, illustrious, illustrious_v90, illustrious_v110 e illustrious_v130.
El paquete compara versiones cuantizadas desde safetensors fp8 escalado y desde el modelo original bf16.
Compatible con modo legacy de baja VRAM en máquinas antiguas, por ejemplo con opciones como --disable-cuda-malloc --lowvram.
Incluye VAE y clips asociados para la versión v130 con archivos fp32-f16.
Licencia Apache 2.0 y DOI 10.57967/hf/4512.

Casos de uso

Generar imágenes de estilo anime o semirrealista desde prompts textuales en ComfyUI.
Probar el rendimiento de variantes GGUF cuantizadas frente a versiones bf16 o fp8 escaladas de Illustrious.
Ejecutar modelos SDXL derivados de Illustrious en equipos con VRAM limitada o hardware antiguo.
Comparar calidad y velocidad entre cuantizaciones como Q4_0, Q8_0, Q6_K y F16.
Crear y reutilizar workflows de ComfyUI mediante archivos JSON o metadatos incrustados en imágenes generadas.