flymy-ai/qwen-image-realism-lora

flymy-ai

Texto a imagen

LoRA para Qwen-Image orientado a aumentar el realismo en generación de imágenes texto-a-imagen. La versión Realism v1.1 mejora el detalle facial, la textura de piel, la reproducción de color, la iluminación y las sombras en paisajes, además de ofrecer mejor representación de distintos rasgos étnicos.

Como usar

Instalación y uso básico con Diffusers:
pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("Qwen/Qwen-Image", dtype=torch.bfloat16, device_map="cuda")
pipe.load_lora_weights("flymy-ai/qwen-image-realism-lora")

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

Inicialización local:
from diffusers import DiffusionPipeline
import torch

model_name = "Qwen/Qwen-Image"

# Load the pipeline
if torch.cuda.is_available():
    torch_dtype = torch.bfloat16
    device = "cuda"
else:
    torch_dtype = torch.float32
    device = "cpu"

pipe = DiffusionPipeline.from_pretrained(model_name, torch_dtype=torch_dtype)
pipe = pipe.to(device)

Carga de pesos LoRA:
# Load LoRA weights
pipe.load_lora_weights('flymy_realism.safetensors', adapter_name="lora")

Generación de imagen:
prompt = '''Super Realism portrait of a teenager woman of African descent, serene calmness, arms crossed, illuminated by dramatic studio lighting, sunlit park in the background, adorned with delicate jewelry, three-quarter view, sun-kissed skin with natural imperfections, loose shoulder-length curls, slightly squinting eyes, environmental street portrait with text "FLYMY AI" on t-shirt.'''
negative_prompt = " "

image = pipe(
    prompt=prompt,
    negative_prompt=negative_prompt,
    width=1024,
    height=1024,
    num_inference_steps=50,
    true_cfg_scale=5,
    generator=torch.Generator(device="cuda").manual_seed(346346)
)

# Display the image (in Jupyter or save to file)
image.show()
# or image.save("output.png")

Funcionalidades

Adaptador LoRA para el modelo base Qwen/Qwen-Image.
Enfocado en resultados fotorealistas para retratos, paisajes, escenas urbanas y movimiento deportivo.
Mejoras específicas en detalle facial fino, textura de piel e imperfecciones naturales.
Reproducción de color más precisa y vibrante en diferentes tipos de escenas.
Iluminación natural y sombras mejoradas, especialmente en paisajes exteriores.
Compatible con Diffusers y con flujos de trabajo de ComfyUI preconfigurados.

Casos de uso

Crear retratos fotorealistas con piel, cabello, iluminación y rasgos faciales más detallados.
Generar paisajes con mayor rango dinámico, sombras naturales y textura de primer plano más nítida.
Producir escenas urbanas nocturnas con reflejos, lluvia, neón y profundidad de campo realistas.
Crear imágenes de deporte o acción con movimiento congelado, sudor, polvo y definición muscular.
Generar retratos corporativos o profesionales con iluminación controlada, bokeh y detalle fino en ropa, pelo y gafas.
Usar Qwen-Image con LoRA desde ComfyUI sin escribir código Python.