unsloth/Qwen-Image-2512-unsloth-bnb-4bit
unsloth
Texto a imagen
Versión cuantizada en 4 bits con BitsAndBytes de Qwen-Image-2512, empaquetada por Unsloth para generación texto-a-imagen con Diffusers. Usa la metodología Unsloth Dynamic 2.0, con capas importantes elevadas a mayor precisión, para reducir el consumo de memoria manteniendo buen rendimiento. Qwen-Image-2512 es la actualización de diciembre del modelo base Qwen-Image y se centra en mayor realismo humano, detalles naturales más finos y mejor renderizado de texto dentro de imágenes.
Como usar
Instalación y uso básico con Diffusers:
pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline
# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained(
"unsloth/Qwen-Image-2512-unsloth-bnb-4bit",
dtype=torch.bfloat16,
device_map="cuda"
)
prompt = "two friends posing in front of a tourist attraction"
image = pipe(prompt).images[0]
Ejemplo recomendado para esta versión cuantizada:
# you will need bitsandbytes to load this
# pip install bitsandbytes
from diffusers import DiffusionPipeline
import torch
pipe = DiffusionPipeline.from_pretrained(
"unsloth/Qwen-Image-2512-unsloth-bnb-4bit",
torch_dtype=torch.bfloat16,
).to('cuda')
# uncomment if you run out of memory
# pipe.enable_model_cpu_offload()
output = pipe(
prompt="a kawaii sloth playing the drums",
negative_prompt="blurry, unfocused",
num_inference_steps=20,
true_cfg_scale=4.0,
)
image = output.images[0]
image.save('sample.png')
Uso con Unsloth Studio en macOS, Linux o WSL:
curl -fsSL https://unsloth.ai/install.sh | sh
unsloth studio -H 0.0.0.0 -p 8888
# Then open http://localhost:8888 in your browser
# Search for unsloth/Qwen-Image-2512-unsloth-bnb-4bit to start chatting
Uso con Unsloth Studio en Windows:
irm https://unsloth.ai/install.ps1 | iex
unsloth studio -H 0.0.0.0 -p 8888
# Then open http://localhost:8888 in your browser
# Search for unsloth/Qwen-Image-2512-unsloth-bnb-4bit to start chatting
Carga con FastModel:
pip install unsloth
from unsloth import FastModel
model, tokenizer = FastModel.from_pretrained(
model_name="unsloth/Qwen-Image-2512-unsloth-bnb-4bit",
max_seq_length=2048,
)
Funcionalidades
- Generación texto-a-imagen con QwenImagePipeline y Diffusers.
- Cuantización BitsAndBytes de 4 bits para ejecución más eficiente.
- Compatible con Safetensors y GGUF.
- Mejor realismo en rostros, piel, cabello y sujetos humanos frente a la versión base anterior.
- Mayor detalle en paisajes, agua, vegetación, pelo de animales y texturas naturales.
- Renderizado de texto mejorado, con mejor composición multimodal, disposición y legibilidad en infografías, pósteres y diapositivas.
- Compatible con Unsloth Studio, Google Colab, Kaggle, Draw Things y DiffusionBee.
- Licencia Apache 2.0.
Casos de uso
- Crear imágenes fotorrealistas de personas con menos aspecto artificial.
- Generar retratos, escenas cotidianas y sujetos humanos con más detalle facial, cabello más definido y mejor contexto visual.
- Crear paisajes, escenas naturales, animales y texturas con mayor fidelidad visual.
- Producir diapositivas, carteles, infografías y composiciones que incluyan texto legible dentro de la imagen.
- Ejecutar Qwen-Image-2512 en entornos con menos memoria gracias a la cuantización de 4 bits.
- Prototipar generación de imágenes localmente con Diffusers o Unsloth Studio.