wikeeyang/Real-Qwen-Image-v1.0
wikeeyang
Texto a imagen
Modelo de texto a imagen basado en Qwen-Image y ajustado para mejorar la claridad y el realismo de las imágenes generadas. Está orientado a producir resultados más nítidos y fotorrealistas, con uso sencillo, generación rápida y buena compatibilidad con LoRA.
Como usar
Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline
# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("wikeeyang/Real-Qwen-Image-v1.0", dtype=torch.bfloat16, device_map="cuda")
prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]
Configuración recomendada del modelo: euler+simple, cfg 1.0, steps 20 - 30. También se pueden probar otras combinaciones.
Funcionalidades
- Texto a imagen con Diffusers
- Ajuste fino de Qwen-Image enfocado en claridad y realismo
- Compatible con flujos de trabajo de ComfyUI incluidos en las imágenes de ejemplo
- Buena compatibilidad con LoRA
- Licencia Apache 2.0
- Soporte de idiomas: inglés y chino
- Arquitectura qwen_image, tamaño aproximado de 20B parámetros
- Versiones cuantizadas GGUF disponibles: Q4_K_M de 13.1 GB y Q8_0 de 21.8 GB
Casos de uso
- Generación de imágenes realistas a partir de texto
- Creación de arte e ilustraciones con mayor nitidez visual
- Flujos de trabajo locales en Diffusers, ComfyUI, Draw Things o DiffusionBee
- Experimentación con LoRA sobre una base Qwen-Image ajustada
- Producción rápida de imágenes fotorrealistas o detalladas