wikeeyang/Real-Qwen-Image-v1.0

wikeeyang

Texto a imagen

Modelo de texto a imagen basado en Qwen-Image y ajustado para mejorar la claridad y el realismo de las imágenes generadas. Está orientado a producir resultados más nítidos y fotorrealistas, con uso sencillo, generación rápida y buena compatibilidad con LoRA.

Como usar

Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("wikeeyang/Real-Qwen-Image-v1.0", dtype=torch.bfloat16, device_map="cuda")

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

Configuración recomendada del modelo: euler+simple, cfg 1.0, steps 20 - 30. También se pueden probar otras combinaciones.

Funcionalidades

Texto a imagen con Diffusers
Ajuste fino de Qwen-Image enfocado en claridad y realismo
Compatible con flujos de trabajo de ComfyUI incluidos en las imágenes de ejemplo
Buena compatibilidad con LoRA
Licencia Apache 2.0
Soporte de idiomas: inglés y chino
Arquitectura qwen_image, tamaño aproximado de 20B parámetros
Versiones cuantizadas GGUF disponibles: Q4_K_M de 13.1 GB y Q8_0 de 21.8 GB

Casos de uso

Generación de imágenes realistas a partir de texto
Creación de arte e ilustraciones con mayor nitidez visual
Flujos de trabajo locales en Diffusers, ComfyUI, Draw Things o DiffusionBee
Experimentación con LoRA sobre una base Qwen-Image ajustada
Producción rápida de imágenes fotorrealistas o detalladas