pixart-900m-1024-ft-v0.7-stage2

bghira

Texto a imagen

Este es un ajuste fino de rango completo derivado de terminusresearch/pixart-900m-1024-ft-v0.6. El modelo se utilizó principalmente con el prompt de validación durante el entrenamiento: un personaje de anime lindo llamado toast, sosteniendo un cartel que dice SOON.

Como usar

Importa y usa el modelo de la siguiente manera en Python:
import torch
from diffusers import DiffusionPipeline

model_id = 'pixart-900m-1024-ft-v0.7-stage2'
pipeline = DiffusionPipeline.from_pretrained(model_id)

prompt = "un personaje de anime lindo llamado toast, sosteniendo un cartel que dice SOON"
prompt_negativo = "borroso, recortado, feo"

pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu')
imagen = pipeline(
  prompt=prompt,
  negative_prompt='borroso, recortado, feo',
  num_inference_steps=30,
  generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(1641421826),
  width=1152,
  height=768,
  guidance_scale=4.0,
  guidance_rescale=0.7,
).images[0]
imagen.save("output.png", format="PNG")

Funcionalidades

Text-to-Image
Diffusers
Safetensors
PixArtSigmaPipeline
stable-diffusion
simpletuner
full

Casos de uso

Generación de imágenes de anime
Creación de escenas detalladas de ciencia ficción
Producción de arte en alta resolución
Renderizado de ambientes cyberpunk y futuristas
Ilustraciones detalladas para historias y cómics
Generación de escenarios fantásticos y mágicos