calcuis/hidream-gguf

calcuis

Texto a imagen

Versión cuantizada en formato GGUF de HiDream-I1-Full para generación de imágenes a partir de texto. Incluye variantes full, dev, fast, e1 y e1-1, junto con componentes GGUF para modelo, codificadores de texto y VAE pensados para funcionar en ComfyUI.

Como usar

Configuración en ComfyUI:

Actualizar el nodo o paquete compatible con el modelo.
Arrastrar hidream a ./ComfyUI/models/diffusion_models.
Arrastrar los codificadores g, l, t5xxl y llama a ./ComfyUI/models/text_encoders.
Arrastrar pig a ./ComfyUI/models/vae.
Cargar el flujo arrastrando el archivo JSON o la imagen demo incluida.

Prompt de ejemplo incluido en la página: una chica anime con orejas grandes de fénec, cola esponjosa, pelo rubio largo despeinado, ojos azules y traje de maid, sosteniendo una tarta selva negra en una mansión victoriana oscura iluminada por velas.

Funcionalidades

Modelo de texto a imagen basado en HiDream-ai/HiDream-I1-Full.
Distribución cuantizada GGUF con opciones de 2, 3, 4, 5, 6 y 8 bits, además de archivos F16/F32 para componentes concretos.
Incluye el conjunto completo necesario en GGUF: modelo de difusión, codificadores de texto y VAE.
Soporte de variantes full, dev, fast, e1 y e1-1.
Preparado para flujos de trabajo en ComfyUI mediante archivos JSON o imágenes demo arrastrables.
Licencia MIT.
Tamaño indicado: 0.7B parámetros; arquitectura indicada: pig.

Casos de uso

Generación de imágenes anime o ilustrativas desde prompts de texto en ComfyUI.
Ejecución local de HiDream-I1-Full en formato GGUF con distintas cuantizaciones según memoria y calidad deseadas.
Pruebas comparativas entre variantes full, fast, dev, 1-clip y 2-clip del flujo HiDream.
Creación de workflows reproducibles de texto a imagen usando componentes GGUF completos.