OpenVision (v1): Estética Midjourney para Todas Tus Imágenes
Corcelio
Texto a imagen
OpenVision es una mejora de estilo de ProteusV0.4 que incorpora a la perfección la cautivadora estética de Midjourney en cada imagen que generes. OpenVision sobresale en ese estilo indescriptible por el que Midjourney es conocido, manteniendo al mismo tiempo un buen rango y detalles nítidos, ¡especialmente en los retratos! Al incorporar la estética de Midjourney directamente en el modelo, OpenVision elimina la necesidad de ajustes manuales o postprocesamiento. Todas las imágenes sintéticas se generaron usando la Red Bittensor. Bittensor descentralizará la IA, y construir modelos de código abierto de última generación es clave. OpenVision es un pequeño paso en nuestro gran viaje.
Como usar
import torch
from diffusers import (StableDiffusionXLPipeline, AutoencoderKL)
# Cargar componente VAE
vae = AutoencoderKL.from_pretrained(
"madebyollin/sdxl-vae-fp16-fix",
torch_dtype=torch.float16
)
# Configurar la pipeline
pipe = StableDiffusionXLPipeline.from_pretrained(
"Corcelio/openvision",
vae=vae,
torch_dtype=torch.float16
)
pipe.to('cuda')
# Definir prompts y generar imagen
prompt = "un gato con gafas de sol en el verano"
negative_prompt = ""
image = pipe(
prompt,
negative_prompt=negative_prompt,
width=1280,
height=1280,
guidance_scale=1.5,
num_inference_steps=30
).images[0]
Funcionalidades
- Incorporación de la estética de Midjourney directamente en el modelo.
- Excelente detalle y rango, especialmente en retratos.
- Eliminación de la necesidad de ajustes manuales o postprocesamiento.
- Generación de imágenes sintéticas utilizando la Red Bittensor.
Casos de uso
- Mejora estilística en imágenes utilizando la estética de Midjourney.
- Generación de retratos con gran detalle y precisión.
- Eliminación de necesidad de postprocesamiento en la generación de imágenes.
- Descentralización de la IA y promoción de modelos de código abierto.