genai-archive/anything-v5

genai-archive

Texto a imagen

Anything V5 es un modelo de texto a imagen para Diffusers basado en Stable Diffusion, distribuido en formato Safetensors y publicado bajo la licencia CreativeML OpenRAIL-M. Forma parte de la serie Anything, orientada a generación de imágenes de estilo anime/ilustración. La variante V5-Prt se describe como una versión especialmente recortada de V5 y la más recomendada, sobre todo cuando se buscan prompts más precisos o mayor compatibilidad con LoRA frente a V3.2++.

Como usar

Parámetros recomendados indicados por la página:
Sampler: Euler A
Steps: 20
CFG: 7
Clip Skip: 2
Negatives: You need, not something that's fixed!

El autor indica que se puede usar cualquier sampler, número de pasos y CFG preferidos. Para mejores resultados recomienda no usar EasyNegative. En AnythingV5 y posteriores, los resultados dependen de prompts precisos; no basta con prompts simples como “1girl”.

Funcionalidades

Generación de imágenes a partir de texto con StableDiffusionPipeline.
Enfoque en estética anime/2D dentro de la familia Anything.
Repositorio re-subido desde ModelScope a Hugging Face con integridad verificada por checksum.
Incluye variantes y notas sobre AnythingV5Ink, AnythingV5PrtRE, NoVAE y V3.2++/Ink.
La variante V5-Prt se recomienda para prompts más precisos y para usar más modelos LoRA.
La versión NoVAE requiere seleccionar un VAE externo en la interfaz web.
Licencia CreativeML OpenRAIL-M, con permiso para copiar, modificar y fusionar el modelo respetando sus términos.

Casos de uso

Crear ilustraciones de estilo anime a partir de prompts textuales.
Usar V5-Prt como base recomendada cuando se necesita mejor compatibilidad con LoRA.
Entrenar LoRA sobre la familia Anything, preferiblemente usando V5 en lugar de V3.2++.
Fusionar el modelo con otros modelos, atribuyendo la fuente si se comparte el modelo fusionado.
Experimentar con variantes de Anything V5, NoVAE y V3.2++/Ink en flujos de Stable Diffusion.