NetaYume Lumina Image v2.0

duongve
Texto a imagen

Modelo de texto a imagen ajustado a partir de Neta Lumina sobre la base abierta Lumina-Image-2.0. Está orientado a generar imágenes de estilo anime de alta calidad, manteniendo parte del conocimiento del modelo base para producir también figuras humanas realistas y composiciones visuales con buen nivel de detalle.

Como usar

Úsalo para generación de imágenes a partir de prompts de texto, especialmente ilustraciones anime con etiquetas estilo Danbooru. El modelo recomienda un prompt de sistema orientado a interpretar mejor instrucciones de imagen y etiquetas.

Configuración recomendada:

CFG: 4–7
Sampling Steps: 40-50
Sampler: Euler a (scheduler: normal)
Sampler alternativo: res_multistep (scheduler: linear_quadratic)

Componentes del modelo:

Text Encoder: Gemma-2-2b preentrenado
VAE: Flux.1 dev preentrenado
Image Backbone: backbone de imagen de NetaLumina ajustado

Funcionalidades

Generación de imágenes anime con contornos nítidos, colores vibrantes y sombreado suave.
Mejor comprensión de personajes, especialmente referencias asociadas al ecosistema Danbooru.
Mayor fidelidad en accesorios, texturas de ropa, peinados y elementos de fondo.
Archivo `NetaYume_Lumina_v2_all_in_one.safetensors` listo para ComfyUI con pesos integrados de VAE, codificador de texto y backbone de imagen.
Basado en `Alpha-VLLM/Lumina-Image-2.0` y ajustado sobre el backbone de imagen de NetaLumina.

Casos de uso

Ilustraciones anime de alta calidad a partir de descripciones textuales.
Generación de personajes con rasgos y vestimenta más coherentes.
Creación de fanart o escenas basadas en etiquetas Danbooru.
Producción de imágenes con detalles finos en peinados, accesorios, ropa y fondos.