aivedha/AgniVedhA

aivedha

Texto a video

AgniVedhA es una cuantización GGUF de zenlm/zen-voyager, un modelo de 33B parámetros con arquitectura Qwen3 orientado a generación de video a partir de texto y uso conversacional. El repositorio duplica las cuantizaciones imatrix de mradermacher/zen-voyager-i1-GGUF y ofrece múltiples variantes de 1 a 6 bits para ejecutar el modelo localmente con llama.cpp, llama-cpp-python, Ollama, LM Studio, Jan, Unsloth Studio, Pi, Hermes Agent, Docker Model Runner o Lemonade. La variante Q4_K_M aparece como recomendada por equilibrio entre velocidad y calidad.

Como usar

Uso directo con Transformers:
# Load model directly
from transformers import AutoModel
model = AutoModel.from_pretrained("aivedha/AgniVedhA", dtype="auto")

Uso con llama-cpp-python:
# !pip install llama-cpp-python
from llama_cpp import Llama
llm = Llama.from_pretrained(
    repo_id="aivedha/AgniVedhA",
    filename="zen-voyager.i1-IQ1_M.gguf",
)
llm.create_chat_completion(
    messages = "\"A young man walking on the street\""
)

Uso con llama.cpp:
curl -LsSf https://llama.app/install.sh | sh
llama serve -hf aivedha/AgniVedhA:Q4_K_M
llama cli -hf aivedha/AgniVedhA:Q4_K_M

Uso con Ollama:
ollama run hf.co/aivedha/AgniVedhA:Q4_K_M

Uso con Docker Model Runner:
docker model run hf.co/aivedha/AgniVedhA:Q4_K_M

Funcionalidades

Modelo GGUF cuantizado de zen-voyager con tamaño base de 33B parámetros.
Arquitectura Qwen3 y plantilla de chat incluida.
Tarea principal declarada: generación de video desde texto.
Incluye cuantizaciones IQ y K desde 1-bit hasta 6-bit, con tamaños aproximados entre 7.32 GB y 26.9 GB.
Q4_K_M se marca como variante rápida y recomendada; Q4_K_S se describe como óptima en tamaño, velocidad y calidad.
Licencia Apache 2.0.
No está desplegado en proveedores de inferencia de Hugging Face en la página proporcionada.
Incluye archivo imatrix para crear cuantizaciones propias.

Casos de uso

Generar videos a partir de prompts de texto, por ejemplo una escena como “A young man walking on the street”.
Ejecutar localmente una versión cuantizada de zen-voyager en equipos con distintas capacidades de memoria.
Probar variantes GGUF para comparar tamaño, velocidad y calidad en flujos con llama.cpp u Ollama.
Servir el modelo localmente mediante una API compatible con OpenAI para herramientas como Pi o Hermes Agent.
Crear cuantizaciones personalizadas a partir del archivo imatrix incluido.