calcuis/cosmos-predict2-gguf
calcuis
Texto a imagen
Versión cuantizada en formato GGUF de Cosmos-Predict2 para generación de imágenes a partir de texto, basada en nvidia/Cosmos-Predict2-2B-Text2Image e incluyendo variantes mencionadas de 2B y 14B. Está pensada para usarse en ComfyUI con gguf-node, sustituyendo el flujo con safetensors por un conjunto GGUF completo de modelo, codificador de texto y VAE.
Como usar
Instalación indicada en la tarjeta del modelo:
- Arrastrar
cosmos a ./ComfyUI/models/diffusion_models
- Arrastrar
t5xxl-old a ./ComfyUI/models/text_encoders
- Arrastrar
pig a ./ComfyUI/models/vae
Ejemplos de prompts incluidos:
On a rainy night, a girl holds an umbrella and looks at the camera. The rain keeps falling.
On a rainy night, a girl holds an umbrella and looks at the camera. The rain keeps falling. a serene atmosphere
The night of the city, from the perspective of the car's front window, real shooting, real scene, late-night emo style, emotional, sad, neon lights, sense of the future, rain, cinematic feel, cyberpunk
Nota del modelo: ya no se necesitan safetensors si se usa el conjunto GGUF completo de modelo, encoder y VAE con gguf-node.
Funcionalidades
- Modelo Text-to-Image en formato GGUF.
- Cuantización GGUF disponible en múltiples niveles, desde 1-bit hasta 8-bit, además de un archivo F16 listado.
- Modelo base indicado: nvidia/Cosmos-Predict2-2B-Text2Image.
- Tamaño de modelo mostrado: 14B parámetros.
- Arquitectura indicada en la página: pig.
- Conjunto GGUF completo: modelo Cosmos, codificador t5xxl-old y VAE pig.
- Compatible con flujo ComfyUI mediante gguf-node.
- Licencia: nvidia-open-model-license.
Casos de uso
- Generar imágenes desde prompts textuales en ComfyUI usando modelos Cosmos-Predict2 cuantizados.
- Ejecutar variantes GGUF de Cosmos-Predict2 con menor peso de archivo que formatos no cuantizados.
- Probar escenas cinematográficas, nocturnas, lluviosas, urbanas o retratos atmosféricos a partir de prompts descriptivos.
- Usar un flujo local de generación de imágenes con modelo, codificador y VAE en GGUF.