Lasorco/lametta

Lasorco

Texto a imagen

Modelo de difusión de texto a imagen basado en Stable Diffusion y orientado a ilustraciones de estilo anime japonés. Es un modelo merge creado para uso personal, con una estética marcada: personajes femeninos de proporciones bajas, ojos redondeados con brillo y resultados especialmente ajustados para variantes chibi/deformadas y anime. El autor recomienda usar prompts relativamente cortos, DPM++ 2M Karras como sampler de referencia, Hires.fix para mejorar detalle y VAE externo o integrado según la versión.

Como usar

Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate

import torch
from diffusers import DiffusionPipeline

# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("Lasorco/lametta", dtype=torch.bfloat16, device_map="cuda")

prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]

Recomendaciones del autor: usar prompts cortos y añadir detalles gradualmente; probar primero la versión v2012 si no se sabe cuál elegir; usar Hires.fix para resultados más pulidos; probar el negativo (low quality, worst quality:1.4) o embeddings negativos como verybadimagenegative_v1.3 o bad_pictures3; configurar VAE al gusto si el integrado no encaja.

Funcionalidades

Generación texto a imagen con Diffusers y pesos Safetensors.
Estética anime japonesa con énfasis en personajes femeninos de baja estatura y ojos grandes/redondeados.
Múltiples versiones del merge: v2012 como versión recomendada, v19xx con acabado más anime, v17xx como mejora de series anteriores, v16xx más deformado/chibi y v15xx con ojos grandes y redondos.
Optimizado principalmente con DPM++ 2M Karras; el autor lo sugiere si hay dudas de configuración.
Compatible con Hires.fix; recomendado para mejorar manos, fondos y definición general.
Uso de VAE variable según versión; v19/v20 incluyen ClearVAE Variant, aunque el autor permite sustituirlo por otro VAE.
Compatibilidad con LoRA no garantizada; algunos LoRA de personajes pueden reflejarse mal por la estilización fuerte del rostro.
Licencia creativeml-openrail-m, con restricciones adicionales contra imitaciones dañinas de obras o estilos protegidos.

Casos de uso

Crear ilustraciones anime de fantasía, personajes estilizados y escenas coloridas a partir de prompts de texto.
Generar personajes con estética chibi o proporciones bajas, especialmente cuando se buscan ojos grandes y expresivos.
Explorar variantes visuales entre versiones del modelo, como acabado más anime, más deformado o con ojos más redondeados.
Usarlo como material para merges derivados, siempre respetando la licencia y las condiciones del autor.
Prototipar imágenes en herramientas locales compatibles con Stable Diffusion, Diffusers, Draw Things o DiffusionBee.