magicbrush-jul7
vinesmsuic
Texto a imagen
Modelo de difusores para la generación de imágenes a partir de texto. Este modelo incluye una versión difusora de MagicBrush-epoch-52-step-4999.ckpt y permite realizar inferencia en imágenes mediante el uso de prompts.
Como usar
Para utilizar este modelo, se puede seguir el siguiente ejemplo en Python:
from PIL import Image, ImageOps
import requests
import torch
from diffusers import StableDiffusionInstructPix2PixPipeline, EulerAncestralDiscreteScheduler
url = "https://huggingface.co/datasets/diffusers/diffusers-images-docs/resolve/main/mountain.png"
def download_image(url):
image = Image.open(requests.get(url, stream=True).raw)
image = ImageOps.exif_transpose(image)
image = image.convert("RGB")
return image
image = download_image(url)
prompt = "make the mountains snowy"
class MagicBrush():
def __init__(self, weight="vinesmsuic/magicbrush-jul7"):
self.pipe = StableDiffusionInstructPix2PixPipeline.from_pretrained(
weight,
torch_dtype=torch.float16
).to("cuda")
self.pipe.scheduler = EulerAncestralDiscreteScheduler.from_config(self.pipe.scheduler.config)
def infer_one_image(self, src_image, instruct_prompt, seed):
generator = torch.manual_seed(seed)
image = self.pipe(instruct_prompt, image=src_image, num_inference_steps=20, image_guidance_scale=1.5, guidance_scale=7, generator=generator).images[0]
return image
model = MagicBrush()
image_output = model.infer_one_image(image, prompt, 42)
image_output
Funcionalidades
- Generación de imágenes a partir de texto
- Adaptación de imágenes existentes mediante el uso de prompts
- Utiliza la biblioteca StableDiffusion
- Compatible con GPU (CUDA)
Casos de uso
- Generación de paisajes nevados a partir de imágenes de montañas
- Adaptación creativa de imágenes según instrucciones específicas
- Uso en proyectos artísticos para generar imágenes personalizadas