pixart-900m-1024-ft-v0.7-stage2
bghira
Texto a imagen
Este es un ajuste fino de rango completo derivado de terminusresearch/pixart-900m-1024-ft-v0.6. El modelo se utilizó principalmente con el prompt de validación durante el entrenamiento: un personaje de anime lindo llamado toast, sosteniendo un cartel que dice SOON.
Como usar
Importa y usa el modelo de la siguiente manera en Python:
import torch
from diffusers import DiffusionPipeline
model_id = 'pixart-900m-1024-ft-v0.7-stage2'
pipeline = DiffusionPipeline.from_pretrained(model_id)
prompt = "un personaje de anime lindo llamado toast, sosteniendo un cartel que dice SOON"
prompt_negativo = "borroso, recortado, feo"
pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu')
imagen = pipeline(
prompt=prompt,
negative_prompt='borroso, recortado, feo',
num_inference_steps=30,
generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(1641421826),
width=1152,
height=768,
guidance_scale=4.0,
guidance_rescale=0.7,
).images[0]
imagen.save("output.png", format="PNG")
Funcionalidades
- Text-to-Image
- Diffusers
- Safetensors
- PixArtSigmaPipeline
- stable-diffusion
- simpletuner
- full
Casos de uso
- Generación de imágenes de anime
- Creación de escenas detalladas de ciencia ficción
- Producción de arte en alta resolución
- Renderizado de ambientes cyberpunk y futuristas
- Ilustraciones detalladas para historias y cómics
- Generación de escenarios fantásticos y mágicos