terminusresearch/pixart-900m-1024-ft-v0.6

terminusresearch

Texto a imagen

Este es un ajuste fino de rango completo derivado de ptx0/pixart-900m-1024-ft-large. El principal prompt de validación utilizado durante el entrenamiento fue: fotografía etnográfica de un osito de peluche en un picnic, con las orejas metidas detrás de una sudadera con capucha acogedora mirando oscuramente a los cielos de picnic tormentosos.

Como usar

import torch
from diffusers import DiffusionPipeline

model_id = 'pixart-900m-1024-ft'
prompt = 'fotografía etnográfica de un osito de peluche en un picnic, con las orejas metidas detrás de una sudadera con capucha acogedora mirando oscuramente a los cielos de picnic tormentosos'
negative_prompt = 'borroso, recortado, feo'
pipeline = DiffusionPipeline.from_pretrained(model_id)
pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu')
image = pipeline(
    prompt=prompt,
    negative_prompt=negative_prompt,
    num_inference_steps=25,
    generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(1641421826),
    width=1152,
    height=768,
    guidance_scale=4.5,
    guidance_rescale=0.0,
).images[0]
image.save('output.png', format='PNG')

Funcionalidades

Text-to-Image
Diffusers
Safetensors
PixArtSigmaPipeline
stable-diffusion
stable-diffusion-diffusers
simpletuner

Casos de uso

Crear imágenes utilizando prompts de texto.
Generar fotografía etnográfica con nivel avanzado de detalle.
Proyectos artísticos y de diseño visual.
Experimentos en la creación de paisajes y escenas imaginativas.