mradermacher/PromptEnhancer-Img2img-Edit-i1-GGUF

mradermacher
Texto a imagen

Cuantización GGUF con imatrix de PromptEnhancer/PromptEnhancer-Img2img-Edit, un modelo visual basado en Qwen/Qwen2.5-VL-32B-Instruct y ajustado para mejorar y reescribir prompts de edición de imagen a imagen. Está publicado en variantes GGUF de 1 a 6 bits para ejecución local con llama.cpp, llama-cpp-python, Ollama, Docker Model Runner, Lemonade y herramientas compatibles.

Como usar

Uso directo con Transformers:

from transformers import AutoModel

model = AutoModel.from_pretrained("mradermacher/PromptEnhancer-Img2img-Edit-i1-GGUF", dtype="auto")

Uso con llama-cpp-python:

# !pip install llama-cpp-python
from llama_cpp import Llama

llm = Llama.from_pretrained(
    repo_id="mradermacher/PromptEnhancer-Img2img-Edit-i1-GGUF",
    filename="PromptEnhancer-Img2img-Edit.i1-IQ1_M.gguf",
)

llm.create_chat_completion(
    messages = "\"Astronaut riding a horse\""
)

Uso local con llama.cpp:

# Instalar con Homebrew
brew install llama.cpp

# Servidor local compatible con OpenAI y UI web
llama-server -hf mradermacher/PromptEnhancer-Img2img-Edit-i1-GGUF:Q4_K_M

# Inferencia directa en terminal
llama-cli -hf mradermacher/PromptEnhancer-Img2img-Edit-i1-GGUF:Q4_K_M

Uso con Ollama:

ollama run hf.co/mradermacher/PromptEnhancer-Img2img-Edit-i1-GGUF:Q4_K_M

Uso con Docker Model Runner:

docker model run hf.co/mradermacher/PromptEnhancer-Img2img-Edit-i1-GGUF:Q4_K_M

Funcionalidades

Modelo GGUF cuantizado de 33B parámetros con arquitectura qwen2vl.
Basado en Qwen/Qwen2.5-VL-32B-Instruct y finetune PromptEnhancer/PromptEnhancer-Img2img-Edit.
Orientado a mejora de prompts, reescritura de prompts y flujos conversacionales para edición img2img.
Incluye cuantizaciones imatrix y variantes IQ/Q de 1, 2, 3, 4, 5 y 6 bits.
Q4_K_M aparece como variante recomendada y Q4_K_S como equilibrio óptimo entre tamaño, velocidad y calidad.
Repositorio marcado como modelo de visión; los archivos mmproj, si existen, se indican en el repositorio estático relacionado.
Licencia Apache 2.0.
No está desplegado actualmente por proveedores de inferencia de Hugging Face.

Casos de uso

Mejorar prompts breves para flujos de generación o edición de imágenes img2img.
Reescribir instrucciones de imagen para hacerlas más completas, estructuradas y útiles para modelos visuales.
Ejecutar localmente un modelo de prompt enhancement en formato GGUF sin depender de proveedores de inferencia alojados.
Probar distintas cuantizaciones para equilibrar memoria, velocidad y calidad en hardware local.
Integrarlo en herramientas compatibles con llama.cpp, Ollama, LM Studio, Jan, Lemonade o Unsloth Studio.