Kivotos XL 2.0

yodayo-ai
Texto a imagen

Kivotos XL 2.0 es la última versión de la serie Yodayo Kivotos XL, siguiendo la iteración anterior, Kivotos XL 1.0. Este modelo de código abierto está construido sobre Animagine XL V3, un modelo SDXL especializado diseñado para generar arte de alta calidad al estilo anime. Kivotos XL V2.0 ha sido afinado y optimizado adicionalmente para centrarse específicamente en generar imágenes que representen con precisión el estilo visual y la estética de la franquicia Blue Archive.

Como usar

Primero, instale las bibliotecas requeridas:

pip install diffusers transformers accelerate safetensors --upgrade

Luego ejecute la generación de imágenes con el siguiente código de ejemplo:

import torch
from diffusers import StableDiffusionXLPipeline

pipe = StableDiffusionXLPipeline.from_pretrained(
"yodayo-ai/kivotos-xl-2.0", 
torch_dtype=torch.float16, 
use_safetensors=True,
custom_pipeline="lpw_stable_diffusion_xl",
add_watermarker=False,
variant="fp16")
pipe.to('cuda')

prompt = "1girl, kazusa \(blue archive\), blue archive, solo, upper body, v, smile, looking at viewer, outdoors, night, masterpiece, best quality, very aesthetic, absurdres"
negative_prompt = "nsfw, (low quality, worst quality:1.2), very displeasing, 3d, watermark, signature, ugly, poorly drawn"

image = pipe(
prompt, 
negative_prompt=negative_prompt,
width=832,
height=1216, 
guidance_scale=7,
num_inference_steps=28
).images[0]

image.save("./cat.png")

Para obtener mejores resultados, se recomienda seguir la plantilla estructurada de prompts: 1girl/1boy, nombre del personaje, de qué serie, por qué artistas, todo lo demás en cualquier orden.

Funcionalidades

Basado en Animagine XL V3
Modelo generativo de texto-a-imagen basado en difusión
Optimizaciones específicas para el arte de Blue Archive
Tags especiales para mejorar la generación de imágenes
Producción de imágenes de alta calidad y estéticamente agradables

Casos de uso

Generación de arte al estilo anime de Blue Archive
Creación de imágenes estéticamente agradables
Producción de contenido visual de alta calidad