chaitnya26/qwen-image-edit-2509-fork

chaitnya26

Texto a imagen

Versión cuantizada con Nunchaku de Qwen-Image-Edit-2509, un modelo de edición de imágenes basado en Qwen-Image y orientado a edición image-to-image con buen manejo de texto complejo dentro de imágenes. Está optimizado para inferencia eficiente mediante SVDQuant en 4 bits, intentando mantener una pérdida mínima de calidad frente al modelo original.

Como usar

Instalación y ejemplo básico con Diffusers:
pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("chaitnya26/qwen-image-edit-2509-fork", dtype=torch.bfloat16, device_map="cuda")

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

Para uso avanzado con Diffusers, la tarjeta del modelo remite a qwen-image-edit-2509.py. Para ComfyUI, remite al flujo nunchaku-qwen-image-edit-2509.json.

Funcionalidades

Modelo de edición de imágenes cuantizado desde Qwen-Image-Edit-2509.
Incluye variantes SVDQuant INT4 para GPU anteriores a Blackwell y variantes NVFP4 para GPU Blackwell serie 50.
Ofrece pesos de rango 32 y rango 128; rango 128 prioriza calidad, pero es más lento.
Incluye variantes Lightning de 4 y 8 pasos fusionadas con Qwen-Image-Lightning mediante LoRA strength 1.0.
Usa Nunchaku como motor de inferencia y deepcompressor como biblioteca de cuantización.
Licencia Apache 2.0.
Basado en el trabajo SVDQuant para modelos de difusión de 4 bits.

Casos de uso

Edición de imágenes con prompts textuales usando una versión más eficiente de Qwen-Image-Edit-2509.
Generación o modificación de imágenes donde sea importante conservar o renderizar texto complejo dentro de la imagen.
Inferencia local de modelos de difusión cuantizados en GPUs compatibles, con opciones separadas para hardware pre-Blackwell y Blackwell.
Flujos rápidos de edición con variantes Lightning de 4 u 8 pasos cuando se prioriza velocidad.
Integración en pipelines Diffusers, ComfyUI o aplicaciones locales compatibles.