OnomaAIResearch/Illustrious-xl-early-release-v0

OnomaAIResearch

Texto a imagen

Illustrious XL v0.1 es un modelo de generación texto-a-imagen basado en Stable Diffusion XL, ajustado por Onoma AI a partir de Kohaku XL Beta 5 y orientado específicamente a ilustración. Fue entrenado con Danbooru2023 para capturar diseños de personajes, estilos visuales y conocimiento artístico propio de ese corpus. La variante v0.1 funciona como modelo base sin ajuste estético o de preferencias, pensado para investigación y para entrenar LoRAs, adaptadores, fusiones y variantes derivadas; la variante v0.1-GUIDED añade controles mínimos de seguridad para usos habituales.

Como usar

Recomendaciones específicas del modelo:

Usar preferentemente la variante GUIDED cuando se busquen controles de seguridad adicionales.
Método de muestreo recomendado: Euler a.
Pasos de muestreo recomendados: 20-28.
CFG recomendado: 5-7.5, ajustable según el caso de uso.
Evitar abusar de etiquetas críticas de composición como close-up, upside-down o cowboy shot, porque pueden entrar en conflicto y degradar los resultados.
Usar etiquetas de composición adecuadas según la escena, por ejemplo upper body, cowboy shot, portrait o full body.
Para prompts negativos, el modelo se beneficia de etiquetas de baja calidad, errores anatómicos y artefactos visuales.

Ejemplos de prompts incluidos en la página:
Prompt: 1boy, holding knife, blue eyes, jewelry, jacket, shirt, open mouth, hand up, simple background, hair between eyes, vest, knife, tongue, holding weapon, grey vest, upper body, necktie, solo, looking at viewer, smile, pink blood, weapon, dagger, open clothes, collared shirt, blood on face, tongue out, blonde hair, holding dagger, red necktie, white shirt, blood, short hair, holding, earrings, long sleeves, black jacket, dark theme
Negative Prompt: worst quality, comic, multiple views, bad quality, low quality, lowres, displeasing, very displeasing, bad anatomy, bad hands, scan artifacts, monochrome, greyscale, signature, twitter username, jpeg artifacts, 2koma, 4koma, guro, extra digits, fewer digits

Prompt: 1girl, extremely dark, black theme, silhouette, rim lighting, black, looking at viewer, low contrast, masterpiece
Negative Prompt: worst quality, comic, multiple views, bad quality, low quality, lowres, displeasing, very displeasing, bad anatomy, bad hands, scan artifacts, monochrome, greyscale, twitter username, jpeg artifacts, 2koma, 4koma, guro, extra digits, fewer digits, jaggy lines, unclear

Funcionalidades

Modelo Stable Diffusion XL especializado en ilustración y generación artística.
Ajustado sobre el conjunto Danbooru2023, con énfasis en personajes, estilos y etiquetas de composición/calidad.
Continuación directa de Kohaku XL Beta 5, diseñado como base para futuras variantes Illustrious XL.
Compatible con entrenamiento de LoRAs, adaptadores, fine-tuning y merges derivados.
Incluye variante GUIDED con mecanismos adicionales de control de seguridad para reducir salidas dañinas o no deseadas.
Soporta etiquetas de calidad como "worst quality", "bad quality", "average quality", "good quality", "best quality" y "masterpiece (quality)".
No tiene un estilo predeterminado en la versión base, lo que permite usarlo como fundamento flexible para estilos derivados.
La serie mantiene compatibilidad hacia atrás para facilitar el entrenamiento y reutilización de LoRAs.

Casos de uso

Generación de ilustraciones a partir de prompts textuales.
Creación de imágenes de personajes con estilos derivados del corpus Danbooru2023.
Investigación sobre modelos generativos de ilustración basados en SDXL.
Entrenamiento de LoRAs y adaptadores para estilos, personajes o conceptos específicos.
Fine-tuning y creación de variantes abiertas basadas en Illustrious XL v0.1.
Experimentación con prompts complejos, composición en lenguaje natural y generación artística de alta resolución.