aivedha/AgniVedhA
aivedha
Texto a video
AgniVedhA es una cuantización GGUF de zenlm/zen-voyager, un modelo de 33B parámetros con arquitectura Qwen3 orientado a generación de video a partir de texto y uso conversacional. El repositorio duplica las cuantizaciones imatrix de mradermacher/zen-voyager-i1-GGUF y ofrece múltiples variantes de 1 a 6 bits para ejecutar el modelo localmente con llama.cpp, llama-cpp-python, Ollama, LM Studio, Jan, Unsloth Studio, Pi, Hermes Agent, Docker Model Runner o Lemonade. La variante Q4_K_M aparece como recomendada por equilibrio entre velocidad y calidad.
Como usar
Uso directo con Transformers:
# Load model directly
from transformers import AutoModel
model = AutoModel.from_pretrained("aivedha/AgniVedhA", dtype="auto")
Uso con llama-cpp-python:
# !pip install llama-cpp-python
from llama_cpp import Llama
llm = Llama.from_pretrained(
repo_id="aivedha/AgniVedhA",
filename="zen-voyager.i1-IQ1_M.gguf",
)
llm.create_chat_completion(
messages = "\"A young man walking on the street\""
)
Uso con llama.cpp:
curl -LsSf https://llama.app/install.sh | sh
llama serve -hf aivedha/AgniVedhA:Q4_K_M
llama cli -hf aivedha/AgniVedhA:Q4_K_M
Uso con Ollama:
ollama run hf.co/aivedha/AgniVedhA:Q4_K_M
Uso con Docker Model Runner:
docker model run hf.co/aivedha/AgniVedhA:Q4_K_M
Funcionalidades
- Modelo GGUF cuantizado de zen-voyager con tamaño base de 33B parámetros.
- Arquitectura Qwen3 y plantilla de chat incluida.
- Tarea principal declarada: generación de video desde texto.
- Incluye cuantizaciones IQ y K desde 1-bit hasta 6-bit, con tamaños aproximados entre 7.32 GB y 26.9 GB.
- Q4_K_M se marca como variante rápida y recomendada; Q4_K_S se describe como óptima en tamaño, velocidad y calidad.
- Licencia Apache 2.0.
- No está desplegado en proveedores de inferencia de Hugging Face en la página proporcionada.
- Incluye archivo imatrix para crear cuantizaciones propias.
Casos de uso
- Generar videos a partir de prompts de texto, por ejemplo una escena como “A young man walking on the street”.
- Ejecutar localmente una versión cuantizada de zen-voyager en equipos con distintas capacidades de memoria.
- Probar variantes GGUF para comparar tamaño, velocidad y calidad en flujos con llama.cpp u Ollama.
- Servir el modelo localmente mediante una API compatible con OpenAI para herramientas como Pi o Hermes Agent.
- Crear cuantizaciones personalizadas a partir del archivo imatrix incluido.