mradermacher/zen-voyager-i1-GGUF

mradermacher

Texto a video

Cuantización GGUF con pesos imatrix del modelo base zenlm/zen-voyager, orientado a generación de vídeo a partir de texto y uso conversacional local. El repositorio ofrece variantes cuantizadas de 1 a 6 bits para ejecutar el modelo con llama.cpp, llama-cpp-python, Ollama, LM Studio, Jan, Unsloth Studio, Pi, Hermes Agent, Docker Model Runner y Lemonade. La variante Q4_K_M se presenta como rápida y recomendada, mientras que Q4_K_S se indica como el mejor equilibrio entre tamaño, velocidad y calidad.

Como usar

Uso con Transformers:
# Load model directly
from transformers import AutoModel
model = AutoModel.from_pretrained("mradermacher/zen-voyager-i1-GGUF", dtype="auto")

Uso con llama-cpp-python:
# !pip install llama-cpp-python
from llama_cpp import Llama
llm = Llama.from_pretrained(
    repo_id="mradermacher/zen-voyager-i1-GGUF",
    filename="zen-voyager.i1-IQ1_M.gguf",
)
llm.create_chat_completion(
    messages = "\"A young man walking on the street\""
)

Uso con llama.cpp:
# Install (macOS, Linux)
curl -LsSf https://llama.app/install.sh | sh

# Start a local OpenAI-compatible server with a web UI:
llama serve -hf mradermacher/zen-voyager-i1-GGUF:Q4_K_M

# Run inference directly in the terminal:
llama cli -hf mradermacher/zen-voyager-i1-GGUF:Q4_K_M

Uso con Ollama:
ollama run hf.co/mradermacher/zen-voyager-i1-GGUF:Q4_K_M

Uso con Docker Model Runner:
docker model run hf.co/mradermacher/zen-voyager-i1-GGUF:Q4_K_M

Funcionalidades

Modelo GGUF cuantizado derivado de zenlm/zen-voyager.
Modelo de 33B parámetros con arquitectura qwen3.
Tarea principal: text-to-video / generación de vídeo desde texto.
Licencia Apache 2.0.
Incluye archivo imatrix para crear cuantizaciones propias.
Ofrece muchas variantes GGUF: IQ1, IQ2, IQ3, IQ4, Q2_K, Q3_K, Q4_K, Q5_K y Q6_K.
Q4_K_M está marcado como rápido y recomendado; Q4_K_S como equilibrio óptimo de tamaño, velocidad y calidad.
No aparece desplegado en proveedores de inferencia de Hugging Face en la página proporcionada.
Descargas recientes indicadas: 626 el último mes.

Casos de uso

Generar vídeo a partir de prompts textuales en entornos locales compatibles con GGUF.
Probar zen-voyager en hardware limitado usando cuantizaciones de bajo bitaje.
Ejecutar un servidor local compatible con la API de OpenAI mediante llama.cpp.
Comparar calidad, velocidad y tamaño entre variantes Q4, Q5 y Q6 del mismo modelo.
Integrar el modelo en flujos locales con Ollama, LM Studio, Jan, Hermes Agent, Pi o Lemonade.