ProteusV0.2

dataautogpt3

Texto a imagen

Proteus sirve como una sofisticada mejora sobre OpenDalleV1.1, aprovechando sus funcionalidades centrales para ofrecer resultados superiores. Las áreas clave de avance incluyen una mayor capacidad de respuesta a los prompts y capacidades creativas aumentadas. Para lograr esto, se afinó utilizando aproximadamente 220,000 imágenes tituladas por GPTV de imágenes sin derechos de autor (incluyendo algunas de anime), que luego fueron normalizadas. Adicionalmente, se empleó DPO (Optimización de Preferencia Directa) a través de una colección de 10,000 pares de imágenes de alta calidad generadas por IA seleccionadas cuidadosamente.

Como usar

import torch
from diffusers import (
StableDiffusionXLPipeline, 
KDPM2AncestralDiscreteScheduler,
AutoencoderKL
)

# Cargar componente VAE
vae = AutoencoderKL.from_pretrained(
"madebyollin/sdxl-vae-fp16-fix", 
torch_dtype=torch.float16
)

# Configurar la tubería
tube = StableDiffusionXLPipeline.from_pretrained(
"dataautogpt3/ProteusV0.2", 
vae=vae,
torch_dtype=torch.float16
)
tube.scheduler = KDPM2AncestralDiscreteScheduler.from_config(tube.scheduler.config)
tube.to('cuda')

# Definir prompts y generar imagen
prompt = "gato negro esponjoso hermoso peligroso, grandes ojos naranjas, grandes orejas esponjosas, mirada penetrante, luna llena, ambiente oscuro, mejor calidad, extremadamente detallado"
negative_prompt = "nsfw, mala calidad, mala anatomía, peor calidad, baja calidad, bajas resoluciones, dedos extra, desenfoque, borroso, feo, malas proporciones, marca de agua, artefactos en la imagen, baja resolución, feo, artefactos jpeg, deformado, imagen ruidosa"

imagen = tube(
prompt, 
negative_prompt=negative_prompt, 
ancho=1024,
altura=1024,
guía_scale=7.5,
número_de_pasos_de_inferencia=50
).imágenes[0]

Funcionalidades

Respondibilidad mejorada a los prompts
Capacidades creativas aumentadas
Mejoras en la representación de características faciales intrincadas y texturas de piel realistas
Proficiencia en varios dominios estéticos, notablemente surrealismo, anime y visualizaciones estilo caricatura

Casos de uso

Generación de imágenes detalladas y realistas a partir de prompts textuales
Aplicaciones en arte surrealista y estético
Creación de visualizaciones estilo anime y caricatura
Mejoras faciales detalladas en visualizaciones