unsloth/Qwen-Image-2512-unsloth-bnb-4bit

unsloth

Texto a imagen

Versión cuantizada en 4 bits con BitsAndBytes de Qwen-Image-2512, empaquetada por Unsloth para generación texto-a-imagen con Diffusers. Usa la metodología Unsloth Dynamic 2.0, con capas importantes elevadas a mayor precisión, para reducir el consumo de memoria manteniendo buen rendimiento. Qwen-Image-2512 es la actualización de diciembre del modelo base Qwen-Image y se centra en mayor realismo humano, detalles naturales más finos y mejor renderizado de texto dentro de imágenes.

Como usar

Instalación y uso básico con Diffusers:
pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained(
    "unsloth/Qwen-Image-2512-unsloth-bnb-4bit",
    dtype=torch.bfloat16,
    device_map="cuda"
)

prompt = "two friends posing in front of a tourist attraction"
image = pipe(prompt).images[0]

Ejemplo recomendado para esta versión cuantizada:
# you will need bitsandbytes to load this
# pip install bitsandbytes

from diffusers import DiffusionPipeline
import torch

pipe = DiffusionPipeline.from_pretrained(
    "unsloth/Qwen-Image-2512-unsloth-bnb-4bit",
    torch_dtype=torch.bfloat16,
).to('cuda')

# uncomment if you run out of memory
# pipe.enable_model_cpu_offload()

output = pipe(
    prompt="a kawaii sloth playing the drums",
    negative_prompt="blurry, unfocused",
    num_inference_steps=20,
    true_cfg_scale=4.0,
)

image = output.images[0]
image.save('sample.png')

Uso con Unsloth Studio en macOS, Linux o WSL:
curl -fsSL https://unsloth.ai/install.sh | sh
unsloth studio -H 0.0.0.0 -p 8888
# Then open http://localhost:8888 in your browser
# Search for unsloth/Qwen-Image-2512-unsloth-bnb-4bit to start chatting

Uso con Unsloth Studio en Windows:
irm https://unsloth.ai/install.ps1 | iex
unsloth studio -H 0.0.0.0 -p 8888
# Then open http://localhost:8888 in your browser
# Search for unsloth/Qwen-Image-2512-unsloth-bnb-4bit to start chatting

Carga con FastModel:
pip install unsloth

from unsloth import FastModel

model, tokenizer = FastModel.from_pretrained(
    model_name="unsloth/Qwen-Image-2512-unsloth-bnb-4bit",
    max_seq_length=2048,
)

Funcionalidades

Generación texto-a-imagen con QwenImagePipeline y Diffusers.
Cuantización BitsAndBytes de 4 bits para ejecución más eficiente.
Compatible con Safetensors y GGUF.
Mejor realismo en rostros, piel, cabello y sujetos humanos frente a la versión base anterior.
Mayor detalle en paisajes, agua, vegetación, pelo de animales y texturas naturales.
Renderizado de texto mejorado, con mejor composición multimodal, disposición y legibilidad en infografías, pósteres y diapositivas.
Compatible con Unsloth Studio, Google Colab, Kaggle, Draw Things y DiffusionBee.
Licencia Apache 2.0.

Casos de uso

Crear imágenes fotorrealistas de personas con menos aspecto artificial.
Generar retratos, escenas cotidianas y sujetos humanos con más detalle facial, cabello más definido y mejor contexto visual.
Crear paisajes, escenas naturales, animales y texturas con mayor fidelidad visual.
Producir diapositivas, carteles, infografías y composiciones que incluyan texto legible dentro de la imagen.
Ejecutar Qwen-Image-2512 en entornos con menos memoria gracias a la cuantización de 4 bits.
Prototipar generación de imágenes localmente con Diffusers o Unsloth Studio.