NetaYume Lumina Image v2.0
duongve
Texto a imagen
Modelo de texto a imagen ajustado a partir de Neta Lumina sobre la base abierta Lumina-Image-2.0. Está orientado a generar imágenes de estilo anime de alta calidad, manteniendo parte del conocimiento del modelo base para producir también figuras humanas realistas y composiciones visuales con buen nivel de detalle.
Como usar
Úsalo para generación de imágenes a partir de prompts de texto, especialmente ilustraciones anime con etiquetas estilo Danbooru. El modelo recomienda un prompt de sistema orientado a interpretar mejor instrucciones de imagen y etiquetas.
Configuración recomendada:
CFG: 4–7
Sampling Steps: 40-50
Sampler: Euler a (scheduler: normal)
Sampler alternativo: res_multistep (scheduler: linear_quadratic)
Componentes del modelo:
Text Encoder: Gemma-2-2b preentrenado
VAE: Flux.1 dev preentrenado
Image Backbone: backbone de imagen de NetaLumina ajustado
Funcionalidades
- Generación de imágenes anime con contornos nítidos, colores vibrantes y sombreado suave.
- Mejor comprensión de personajes, especialmente referencias asociadas al ecosistema Danbooru.
- Mayor fidelidad en accesorios, texturas de ropa, peinados y elementos de fondo.
- Archivo `NetaYume_Lumina_v2_all_in_one.safetensors` listo para ComfyUI con pesos integrados de VAE, codificador de texto y backbone de imagen.
- Basado en `Alpha-VLLM/Lumina-Image-2.0` y ajustado sobre el backbone de imagen de NetaLumina.
Casos de uso
- Ilustraciones anime de alta calidad a partir de descripciones textuales.
- Generación de personajes con rasgos y vestimenta más coherentes.
- Creación de fanart o escenas basadas en etiquetas Danbooru.
- Producción de imágenes con detalles finos en peinados, accesorios, ropa y fondos.