chaitnya26/qwen-image-edit-2509-fork
chaitnya26
Texto a imagen
Versión cuantizada con Nunchaku de Qwen-Image-Edit-2509, un modelo de edición de imágenes basado en Qwen-Image y orientado a edición image-to-image con buen manejo de texto complejo dentro de imágenes. Está optimizado para inferencia eficiente mediante SVDQuant en 4 bits, intentando mantener una pérdida mínima de calidad frente al modelo original.
Como usar
Instalación y ejemplo básico con Diffusers:
pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline
# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("chaitnya26/qwen-image-edit-2509-fork", dtype=torch.bfloat16, device_map="cuda")
prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]
Para uso avanzado con Diffusers, la tarjeta del modelo remite a qwen-image-edit-2509.py. Para ComfyUI, remite al flujo nunchaku-qwen-image-edit-2509.json.
Funcionalidades
- Modelo de edición de imágenes cuantizado desde Qwen-Image-Edit-2509.
- Incluye variantes SVDQuant INT4 para GPU anteriores a Blackwell y variantes NVFP4 para GPU Blackwell serie 50.
- Ofrece pesos de rango 32 y rango 128; rango 128 prioriza calidad, pero es más lento.
- Incluye variantes Lightning de 4 y 8 pasos fusionadas con Qwen-Image-Lightning mediante LoRA strength 1.0.
- Usa Nunchaku como motor de inferencia y deepcompressor como biblioteca de cuantización.
- Licencia Apache 2.0.
- Basado en el trabajo SVDQuant para modelos de difusión de 4 bits.
Casos de uso
- Edición de imágenes con prompts textuales usando una versión más eficiente de Qwen-Image-Edit-2509.
- Generación o modificación de imágenes donde sea importante conservar o renderizar texto complejo dentro de la imagen.
- Inferencia local de modelos de difusión cuantizados en GPUs compatibles, con opciones separadas para hardware pre-Blackwell y Blackwell.
- Flujos rápidos de edición con variantes Lightning de 4 u 8 pasos cuando se prioriza velocidad.
- Integración en pipelines Diffusers, ComfyUI o aplicaciones locales compatibles.