Lasorco/lametta
Modelo de difusión de texto a imagen basado en Stable Diffusion y orientado a ilustraciones de estilo anime japonés. Es un modelo merge creado para uso personal, con una estética marcada: personajes femeninos de proporciones bajas, ojos redondeados con brillo y resultados especialmente ajustados para variantes chibi/deformadas y anime. El autor recomienda usar prompts relativamente cortos, DPM++ 2M Karras como sampler de referencia, Hires.fix para mejorar detalle y VAE externo o integrado según la versión.
Como usar
Instalación y uso con Diffusers:
pip install -U diffusers transformers accelerate
import torch
from diffusers import DiffusionPipeline
# switch to "mps" for apple devices
pipe = DiffusionPipeline.from_pretrained("Lasorco/lametta", dtype=torch.bfloat16, device_map="cuda")
prompt = "Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
image = pipe(prompt).images[0]
Recomendaciones del autor: usar prompts cortos y añadir detalles gradualmente; probar primero la versión v2012 si no se sabe cuál elegir; usar Hires.fix para resultados más pulidos; probar el negativo (low quality, worst quality:1.4) o embeddings negativos como verybadimagenegative_v1.3 o bad_pictures3; configurar VAE al gusto si el integrado no encaja.
Funcionalidades
- Generación texto a imagen con Diffusers y pesos Safetensors.
- Estética anime japonesa con énfasis en personajes femeninos de baja estatura y ojos grandes/redondeados.
- Múltiples versiones del merge: v2012 como versión recomendada, v19xx con acabado más anime, v17xx como mejora de series anteriores, v16xx más deformado/chibi y v15xx con ojos grandes y redondos.
- Optimizado principalmente con DPM++ 2M Karras; el autor lo sugiere si hay dudas de configuración.
- Compatible con Hires.fix; recomendado para mejorar manos, fondos y definición general.
- Uso de VAE variable según versión; v19/v20 incluyen ClearVAE Variant, aunque el autor permite sustituirlo por otro VAE.
- Compatibilidad con LoRA no garantizada; algunos LoRA de personajes pueden reflejarse mal por la estilización fuerte del rostro.
- Licencia creativeml-openrail-m, con restricciones adicionales contra imitaciones dañinas de obras o estilos protegidos.
Casos de uso
- Crear ilustraciones anime de fantasía, personajes estilizados y escenas coloridas a partir de prompts de texto.
- Generar personajes con estética chibi o proporciones bajas, especialmente cuando se buscan ojos grandes y expresivos.
- Explorar variantes visuales entre versiones del modelo, como acabado más anime, más deformado o con ojos más redondeados.
- Usarlo como material para merges derivados, siempre respetando la licencia y las condiciones del autor.
- Prototipar imágenes en herramientas locales compatibles con Stable Diffusion, Diffusers, Draw Things o DiffusionBee.