ProteusV0.2
dataautogpt3
Texto a imagen
Proteus sirve como una sofisticada mejora sobre OpenDalleV1.1, aprovechando sus funcionalidades centrales para ofrecer resultados superiores. Las áreas clave de avance incluyen una mayor capacidad de respuesta a los prompts y capacidades creativas aumentadas. Para lograr esto, se afinó utilizando aproximadamente 220,000 imágenes tituladas por GPTV de imágenes sin derechos de autor (incluyendo algunas de anime), que luego fueron normalizadas. Adicionalmente, se empleó DPO (Optimización de Preferencia Directa) a través de una colección de 10,000 pares de imágenes de alta calidad generadas por IA seleccionadas cuidadosamente.
Como usar
import torch
from diffusers import (
StableDiffusionXLPipeline,
KDPM2AncestralDiscreteScheduler,
AutoencoderKL
)
# Cargar componente VAE
vae = AutoencoderKL.from_pretrained(
"madebyollin/sdxl-vae-fp16-fix",
torch_dtype=torch.float16
)
# Configurar la tubería
tube = StableDiffusionXLPipeline.from_pretrained(
"dataautogpt3/ProteusV0.2",
vae=vae,
torch_dtype=torch.float16
)
tube.scheduler = KDPM2AncestralDiscreteScheduler.from_config(tube.scheduler.config)
tube.to('cuda')
# Definir prompts y generar imagen
prompt = "gato negro esponjoso hermoso peligroso, grandes ojos naranjas, grandes orejas esponjosas, mirada penetrante, luna llena, ambiente oscuro, mejor calidad, extremadamente detallado"
negative_prompt = "nsfw, mala calidad, mala anatomía, peor calidad, baja calidad, bajas resoluciones, dedos extra, desenfoque, borroso, feo, malas proporciones, marca de agua, artefactos en la imagen, baja resolución, feo, artefactos jpeg, deformado, imagen ruidosa"
imagen = tube(
prompt,
negative_prompt=negative_prompt,
ancho=1024,
altura=1024,
guía_scale=7.5,
número_de_pasos_de_inferencia=50
).imágenes[0]
Funcionalidades
- Respondibilidad mejorada a los prompts
- Capacidades creativas aumentadas
- Mejoras en la representación de características faciales intrincadas y texturas de piel realistas
- Proficiencia en varios dominios estéticos, notablemente surrealismo, anime y visualizaciones estilo caricatura
Casos de uso
- Generación de imágenes detalladas y realistas a partir de prompts textuales
- Aplicaciones en arte surrealista y estético
- Creación de visualizaciones estilo anime y caricatura
- Mejoras faciales detalladas en visualizaciones