flymy-ai/qwen-image-realism-lora
flymy-ai
Texto a imagen
LoRA para Qwen-Image orientado a aumentar el realismo en generación de imágenes texto-a-imagen. La versión Realism v1.1 mejora el detalle facial, la textura de piel, la reproducción de color, la iluminación y las sombras en paisajes, además de ofrecer mejor representación de distintos rasgos étnicos.
Como usar
Instalación y uso básico con Diffusers:
pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline
# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("Qwen/Qwen-Image", dtype=torch.bfloat16, device_map="cuda")
pipe.load_lora_weights("flymy-ai/qwen-image-realism-lora")
prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]
Inicialización local:
from diffusers import DiffusionPipeline
import torch
model_name = "Qwen/Qwen-Image"
# Load the pipeline
if torch.cuda.is_available():
torch_dtype = torch.bfloat16
device = "cuda"
else:
torch_dtype = torch.float32
device = "cpu"
pipe = DiffusionPipeline.from_pretrained(model_name, torch_dtype=torch_dtype)
pipe = pipe.to(device)
Carga de pesos LoRA:
# Load LoRA weights
pipe.load_lora_weights('flymy_realism.safetensors', adapter_name="lora")
Generación de imagen:
prompt = '''Super Realism portrait of a teenager woman of African descent, serene calmness, arms crossed, illuminated by dramatic studio lighting, sunlit park in the background, adorned with delicate jewelry, three-quarter view, sun-kissed skin with natural imperfections, loose shoulder-length curls, slightly squinting eyes, environmental street portrait with text "FLYMY AI" on t-shirt.'''
negative_prompt = " "
image = pipe(
prompt=prompt,
negative_prompt=negative_prompt,
width=1024,
height=1024,
num_inference_steps=50,
true_cfg_scale=5,
generator=torch.Generator(device="cuda").manual_seed(346346)
)
# Display the image (in Jupyter or save to file)
image.show()
# or image.save("output.png")
Funcionalidades
- Adaptador LoRA para el modelo base Qwen/Qwen-Image.
- Enfocado en resultados fotorealistas para retratos, paisajes, escenas urbanas y movimiento deportivo.
- Mejoras específicas en detalle facial fino, textura de piel e imperfecciones naturales.
- Reproducción de color más precisa y vibrante en diferentes tipos de escenas.
- Iluminación natural y sombras mejoradas, especialmente en paisajes exteriores.
- Compatible con Diffusers y con flujos de trabajo de ComfyUI preconfigurados.
Casos de uso
- Crear retratos fotorealistas con piel, cabello, iluminación y rasgos faciales más detallados.
- Generar paisajes con mayor rango dinámico, sombras naturales y textura de primer plano más nítida.
- Producir escenas urbanas nocturnas con reflejos, lluvia, neón y profundidad de campo realistas.
- Crear imágenes de deporte o acción con movimiento congelado, sudor, polvo y definición muscular.
- Generar retratos corporativos o profesionales con iluminación controlada, bokeh y detalle fino en ropa, pelo y gafas.
- Usar Qwen-Image con LoRA desde ComfyUI sin escribir código Python.