calcuis/pony

calcuis
Texto a imagen

Paquete de modelos heredados para generación de imágenes tipo anime en formato GGUF, preparado como pack adicional de pruebas para gguf-node y ComfyUI. El repositorio agrupa variantes como blackmagic, boleromix, cyberrealistic_v7, doll, goofball, pixelart, snow y watercolor, con arquitectura SDXL y cuantizaciones desde Q2_K hasta F16 para facilitar ejecución en máquinas antiguas o con poca VRAM.

Como usar

Uso indicado por la tarjeta del modelo:

  1. Copiar los archivos GGUF en ./ComfyUI/models/diffusion_models.
  2. Copiar los codificadores CLIP, por ejemplo g-clip y l-clip, en ./ComfyUI/models/text_encoders.
  3. Copiar el VAE legacy en ./ComfyUI/models/vae.
  4. Para ejecución sin instalación manual, descargar el paquete de ComfyUI con el nuevo gguf-node y ejecutar el archivo .bat del directorio principal.
  5. Para cargar un flujo, arrastrar cualquier archivo JSON de workflow al navegador activo, o arrastrar una imagen/video generado que contenga metadata de workflow.

Ejemplo de prompt incluido en el widget:

score_9, score_8_up, score_7_up, film grain, photo by fuji-proplus-ii film, raw picture of 20 years old woman in lingerie, portrait, deep blue sky, cloudy sky, outdoor, high key light, soft shadow, Fiery clouds, colored hair

Prompt negativo incluido:

score_6, score_5, score_4, source_pony, (worst quality:1.2), (low quality:1.2), (normal quality:1.2), lowres, bad anatomy, bad hands, signature, watermarks, ugly, imperfect eyes, skewed eyes, unnatural face, unnatural body, error, extra limb, missing limbs, painting by bad-artist

Funcionalidades

Tarea principal: generación de imagen a partir de texto.
Formato GGUF compatible con gguf-node y flujos de ComfyUI.
Arquitectura SDXL, indicada en la metadata GGUF.
Incluye múltiples variantes de estilo y varias cuantizaciones por variante: Q2_K, Q3_K, Q4, Q5, Q6_K, Q8_0 y F16.
Pensado para modelos legacy de anime, donde el autor recomienda usar etiquetas o palabras clave como entrada para obtener resultados más precisos.
Puede ejecutarse en hardware antiguo, incluyendo modo legacy con low VRAM según la tarjeta del modelo.
Licencia Apache 2.0 y DOI 10.57967/hf/4341.

Casos de uso

Generar imágenes estilo anime o variantes estilizadas desde prompts etiquetados en ComfyUI.
Probar gguf-node con modelos SDXL heredados convertidos a GGUF.
Ejecutar modelos de imagen en equipos antiguos o con poca memoria usando cuantizaciones ligeras.
Comparar el mismo descriptor entre variantes como boleromix, snow, pixelart o watercolor.