terminusresearch/pixart-900m-1024-ft-v0.6
terminusresearch
Texto a imagen
Este es un ajuste fino de rango completo derivado de ptx0/pixart-900m-1024-ft-large. El principal prompt de validación utilizado durante el entrenamiento fue: fotografía etnográfica de un osito de peluche en un picnic, con las orejas metidas detrás de una sudadera con capucha acogedora mirando oscuramente a los cielos de picnic tormentosos.
Como usar
import torch
from diffusers import DiffusionPipeline
model_id = 'pixart-900m-1024-ft'
prompt = 'fotografía etnográfica de un osito de peluche en un picnic, con las orejas metidas detrás de una sudadera con capucha acogedora mirando oscuramente a los cielos de picnic tormentosos'
negative_prompt = 'borroso, recortado, feo'
pipeline = DiffusionPipeline.from_pretrained(model_id)
pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu')
image = pipeline(
prompt=prompt,
negative_prompt=negative_prompt,
num_inference_steps=25,
generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(1641421826),
width=1152,
height=768,
guidance_scale=4.5,
guidance_rescale=0.0,
).images[0]
image.save('output.png', format='PNG')
Funcionalidades
- Text-to-Image
- Diffusers
- Safetensors
- PixArtSigmaPipeline
- stable-diffusion
- stable-diffusion-diffusers
- simpletuner
Casos de uso
- Crear imágenes utilizando prompts de texto.
- Generar fotografía etnográfica con nivel avanzado de detalle.
- Proyectos artísticos y de diseño visual.
- Experimentos en la creación de paisajes y escenas imaginativas.